El error residual en estadística matemática se refiere a la diferencia entre el valor real observado y el valor estimado (valor ajustado). Los "residuales" contienen información importante sobre los supuestos subyacentes del modelo. Si el modelo de regresión es correcto, podemos considerar los residuos como observaciones de errores.
Debe ajustarse a los supuestos del modelo y tener algunas propiedades del error. El uso de la información proporcionada por los residuos para examinar la racionalidad de los supuestos del modelo y la confiabilidad de los datos se denomina análisis residual.
Hay tantos residuos como pares de datos. El análisis residual consiste en analizar la confiabilidad, periodicidad u otra interferencia de los datos a través de la información proporcionada por el residual.
Residuos ordinarios
Supongamos que el modelo de regresión lineal es
donde Y es un vector n-dimensional compuesto por variables de respuesta y X es
Matriz de diseño de primer orden, β es un vector p + 1 dimensión y ε es una variable aleatoria n-dimensional.
El valor estimado del coeficiente de regresión
, el valor de ajuste
es
, donde
es llamada H es la matriz del sombrero. El residual es
Esto explica la relación entre la matriz hat y el residual, porque el residual se puede obtener de la matriz hat y el valor verdadero.
En el análisis de regresión, la diferencia entre el valor medido y el valor predicho según la ecuación de regresión se expresa como δ. El residual δ sigue la distribución normal N(0, σ2). (δ-media de los residuos)/desviación estándar de los residuos, denominados residuos estandarizados, expresados como δ*. δ* sigue la distribución normal estándar N(0,1). La probabilidad de que el residual estandarizado del punto experimental quede fuera del intervalo (-2, 2) es ≤ 0,05. Si el residuo estandarizado de un determinado punto experimental queda fuera del intervalo (-2, 2), puede juzgarse como un punto experimental anormal con un nivel de confianza del 95% y no participará en el ajuste de la línea de regresión.
Evidentemente, hay tantos residuos como pares de datos. El análisis residual consiste en analizar la confiabilidad, periodicidad u otra interferencia de los datos a través de la información proporcionada por el residual.
El análisis residual consiste en analizar la fiabilidad, periodicidad u otras interferencias de los datos a través de la información proporcionada por el residual. Un método utilizado para analizar si los supuestos de un modelo son correctos. El llamado residual se refiere a la diferencia entre el valor observado y el valor predicho (valor ajustado), es decir, la diferencia entre el valor observado real y el valor estimado de regresión. En el análisis de regresión, la diferencia entre el valor medido y el valor predicho por la ecuación de regresión se expresa como δ. El residual δ sigue la distribución normal N(0, σ2).
(δ-media de los residuos)/desviación estándar de los residuos se denomina residuos estandarizados y se expresa como δ*. δ* sigue la distribución normal estándar N(0,1). La probabilidad de que el residual estandarizado del punto experimental quede fuera del intervalo (-2, 2) es ≤ 0,05. Si el residuo estandarizado de un determinado punto experimental queda fuera del intervalo (-2, 2), puede juzgarse como un punto experimental anormal con un nivel de confianza del 95% y no participará en el ajuste de la línea de regresión. Obviamente, hay tantos residuos como pares de datos.