La fórmula de cálculo del coeficiente de correlación r es ρXY=Cov(X,Y)/√[D(X)]√[D(Y)].
Descripción de la fórmula: En la fórmula, Cov(X, Y) es la covarianza de X e Y, y D(X) y D(Y) son las varianzas de X e Y respectivamente.
Fórmula.
Si Y=a bX, entonces:
Sean E(X) =μ, D(X) =σ.
Entonces E(Y) = bμ+a, D(Y) = bσ.
E(XY) = E(aX bX) = aμ+b(σ+μ).
Cov(X,Y) = E(XY)?E(X)E(Y) = bσ.
Desventajas
Cabe señalar que el coeficiente de correlación tiene una desventaja obvia, es decir, el grado en que se acerca a 1 está relacionado con el número de grupos de datos n. , lo que fácilmente da a la gente una ilusión. Porque, cuando n es pequeño, el coeficiente de correlación fluctúa mucho y es fácil que el valor absoluto del coeficiente de correlación se acerque a 1 para algunas muestras.
Cuando n es grande, el valor absoluto del coeficiente de correlación tiende a ser pequeño. Especialmente cuando n=2, el valor absoluto del coeficiente de correlación es siempre 1. Por lo tanto, cuando el tamaño de la muestra n es pequeño, no es apropiado que juzguemos que existe una relación lineal estrecha entre las variables xey simplemente basándonos en un coeficiente de correlación grande.