¿Qué es el análisis de regresión por pasos?

La idea básica del método de análisis de regresión por pasos es seleccionar automáticamente las variables más importantes de una gran cantidad de variables disponibles para establecer un modelo de predicción o explicación para el análisis de regresión. La idea básica es: introducir las variables independientes una por una, y la condición para la introducción es que la suma de cuadrados de la regresión parcial sea significativa después de la prueba. Al mismo tiempo, cada vez que se introduce una nueva variable independiente, las antiguas variables independientes deben probarse una por una y las variables independientes con sumas de cuadrados de regresión parcial insignificante deben eliminarse. Esto continúa introduciendo y eliminando hasta que no se introducen nuevas variables ni se eliminan variables antiguas. Su esencia es establecer la ecuación de regresión lineal múltiple "óptima".

Los pasos específicos son los siguientes: primero use la variable explicada para hacer una regresión simple para cada variable explicativa considerada, y luego use la ecuación de regresión correspondiente a la variable explicativa que más contribuye a la variable explicada como la base y luego introducir gradualmente las variables explicativas restantes. Después de la regresión gradual, las variables explicativas finalmente retenidas en el modelo son importantes y no tienen una multilinealidad seria.