La paradoja de Simpson

La paradoja de Simpson es una paradoja muy importante en estadística. Se utiliza a menudo en análisis experimentales y tiene un efecto muy contrario a la intuición.

La definición de Wikipedia es la siguiente:

Pongamos un ejemplo muy simple:

El padre de Xiao Ming le pidió a Xiao Ming que fuera al mercado de verduras a comprar manzanas y Plátanos* **10 kilogramos

Las manzanas cuestan 1 yuan por kilogramo, Xiao Ming compró 1 kilogramo y gastó 1 * 1 = 1 yuan

Los plátanos cuestan 2 yuanes por kilogramo, Xiao Ming les compré 9 catties, costando 2 * 9 = 18 yuanes

Si calculamos el precio unitario promedio de las frutas que compró Xiao Ming = 19 / 10 = 1,9 yuanes/catty

El tiempo vuela , años Al igual que Suo, Xiao Ming ahora está casado y tiene hijos. Ese día, Xiao Ming le pidió a Xiao Ming que fuera al mercado de verduras a comprar manzanas y plátanos, cada uno de los cuales pesaba 10 libras. Debido a la inflación, los precios de las manzanas y los plátanos han aumentado

Las manzanas cuestan 1 yuan y 5 yuanes por malicioso Xiao Ming compró 8 jins y gastó 1,5 * 8 = 12 yuanes

Plátano. 2 5 yuanes por malicioso, Xiao Ming compró 2 jins y gastó 1,5 * 2 = 5 yuanes

El precio unitario promedio de la fruta es 17/10 = 1,7 yuanes/malicioso

Xiao Ming estaba desconcertado. Bien, ¿por qué ha bajado el precio unitario total a pesar de que los precios de ambas frutas obviamente han aumentado? Xiao Ming dijo: Papá, eres tan estúpido porque compré más frutas baratas y menos caras.

Esta es la aplicación más simple y común de la Paradoja de Simpson. Al realizar experimentos A/B, a menudo comparamos los cambios en los indicadores totales (Métricas) del grupo experimental y el grupo de control. Los cambios en cada categoría a veces conducirán a la conclusión completamente opuesta, convirtiéndose en un estúpido Xiao Ming. Este fenómeno también se denomina generalmente Mix-Shift