La paradoja de Simpson es una paradoja muy importante en estadística. Se utiliza a menudo en análisis experimentales y tiene un efecto muy contrario a la intuición.
La definición de Wikipedia es la siguiente:
Pongamos un ejemplo muy simple:
El padre de Xiao Ming le pidió a Xiao Ming que fuera al mercado de verduras a comprar manzanas y Plátanos* **10 kilogramos
Las manzanas cuestan 1 yuan por kilogramo, Xiao Ming compró 1 kilogramo y gastó 1 * 1 = 1 yuan
Los plátanos cuestan 2 yuanes por kilogramo, Xiao Ming les compré 9 catties, costando 2 * 9 = 18 yuanes
Si calculamos el precio unitario promedio de las frutas que compró Xiao Ming = 19 / 10 = 1,9 yuanes/catty
El tiempo vuela , años Al igual que Suo, Xiao Ming ahora está casado y tiene hijos. Ese día, Xiao Ming le pidió a Xiao Ming que fuera al mercado de verduras a comprar manzanas y plátanos, cada uno de los cuales pesaba 10 libras. Debido a la inflación, los precios de las manzanas y los plátanos han aumentado
Las manzanas cuestan 1 yuan y 5 yuanes por malicioso Xiao Ming compró 8 jins y gastó 1,5 * 8 = 12 yuanes
Plátano. 2 5 yuanes por malicioso, Xiao Ming compró 2 jins y gastó 1,5 * 2 = 5 yuanes
El precio unitario promedio de la fruta es 17/10 = 1,7 yuanes/malicioso
Xiao Ming estaba desconcertado. Bien, ¿por qué ha bajado el precio unitario total a pesar de que los precios de ambas frutas obviamente han aumentado? Xiao Ming dijo: Papá, eres tan estúpido porque compré más frutas baratas y menos caras.
Esta es la aplicación más simple y común de la Paradoja de Simpson. Al realizar experimentos A/B, a menudo comparamos los cambios en los indicadores totales (Métricas) del grupo experimental y el grupo de control. Los cambios en cada categoría a veces conducirán a la conclusión completamente opuesta, convirtiéndose en un estúpido Xiao Ming. Este fenómeno también se denomina generalmente Mix-Shift