¿Cuál es la fórmula para calcular el coeficiente de correlación?

La fórmula de cálculo del coeficiente de correlación r es ρXY=Cov(X,Y)/√[D(X)]√[D(Y)].

Descripción de la fórmula: En la fórmula, Cov(X, Y) es la covarianza de X e Y, y D(X) y D(Y) son las varianzas de X e Y respectivamente.

Fórmula.

Si Y=a bX, entonces:

Sean E(X) =μ, D(X) =σ.

Entonces E(Y) = bμ+a, D(Y) = bσ.

E(XY) = E(aX bX) = aμ+b(σ+μ).

Cov(X,Y) = E(XY)?E(X)E(Y) = bσ.

Desventajas

Cabe señalar que el coeficiente de correlación tiene una desventaja obvia, es decir, el grado en que se acerca a 1 está relacionado con el número de grupos de datos n. , lo que fácilmente da a la gente una ilusión. Porque, cuando n es pequeño, el coeficiente de correlación fluctúa mucho y es fácil que el valor absoluto del coeficiente de correlación se acerque a 1 para algunas muestras.

Cuando n es grande, el valor absoluto del coeficiente de correlación tiende a ser pequeño. Especialmente cuando n=2, el valor absoluto del coeficiente de correlación es siempre 1. Por lo tanto, cuando el tamaño de la muestra n es pequeño, no es apropiado que juzguemos que existe una relación lineal estrecha entre las variables xey simplemente basándonos en un coeficiente de correlación grande.