1. Análisis de varianza unidireccional:
Se utiliza para estudiar si diferentes niveles de una variable de control tienen un impacto significativo sobre las variables observadas. Aquí, dado que solo se estudia la influencia de un único factor sobre las variables observadas, se denomina análisis de varianza unidireccional.
Por ejemplo, analizar si diferentes cantidades de fertilizantes tienen un impacto significativo en el rendimiento de los cultivos, examinar si las diferencias regionales afectan las tasas de fertilidad de las mujeres y estudiar el impacto de las calificaciones académicas en los ingresos salariales, etc. Estas preguntas pueden responderse mediante un análisis de varianza unidireccional.
El primer paso en el análisis de varianza unidireccional es aclarar las variables observadas y las variables de control. Por ejemplo, las variables observadas en la pregunta anterior son el rendimiento de los cultivos, la tasa de fertilidad femenina y los ingresos salariales; las variables de control son la cantidad de fertilizante, la región y el nivel educativo.
El segundo paso del ANOVA unidireccional es analizar la varianza de las variables observadas. El análisis de varianza cree que los cambios en los valores de las variables observadas se verán afectados tanto por las variables de control como por las variables aleatorias. En consecuencia, el análisis de varianza de un factor descompone la suma total de las desviaciones al cuadrado de las variables observadas en dos partes: la suma de las desviaciones al cuadrado entre grupos y la suma de las desviaciones al cuadrado dentro de un grupo. Se expresa en forma matemática como: SST=. ASS+ESS.
El tercer paso del análisis de varianza de un solo factor es inferir si las variables de control tienen un impacto significativo en las variables observadas comparando las proporciones de cada parte de la desviación cuadrada total de las variables observadas.
Pasos básicos del análisis de varianza de un solo factor:
Proponer la hipótesis nula; seleccionar el estadístico de prueba; calcular el valor observado y el valor P de probabilidad del estadístico de prueba dado el nivel de significancia; y tomar decisiones.
2. Análisis de varianza de dos factores
El análisis de varianza de dos factores (Análisis de varianza de doble factor) tiene dos tipos: uno es un análisis de varianza de dos factores sin interacción, que asume el factor A. Los efectos del factor A y del factor B son independientes entre sí y no tienen interrelación; el otro es un análisis de varianza de dos factores con interacción, que supone que la combinación del factor A y el factor B producirá un nuevo efecto.
Por ejemplo, si se supone que los consumidores de diferentes regiones tienen preferencias especiales por una determinada marca que son diferentes a los consumidores de otras regiones, este es un nuevo efecto producido por la combinación de dos factores, y pertenece al fondo de interacción; de lo contrario, es un fondo no interactivo; Aquí hay un ANOVA de dos vías sin interacciones.
La idea básica del análisis de varianza de dos factores: al analizar la contribución de la variación de diferentes fuentes a la variación total en el estudio, se determina la influencia de los factores controlables en los resultados de la investigación.
3. Análisis de varianza multifactorial
La esencia del análisis de varianza multifactorial también utiliza el método de inferencia estadística, y sus pasos básicos son completamente consistentes con la prueba de hipótesis.
(1) Proponer la hipótesis nula
El primer paso en el análisis de varianza multifactorial es aclarar las variables observadas y varias variables de control, y luego proponer la hipótesis nula sobre esta base. .
La hipótesis nula del análisis de varianza multifactorial es: no existe diferencia significativa en los valores medios de las variables observadas en diferentes niveles de cada variable de control, y los efectos y efectos de interacción de las Las variables de control son 0 al mismo tiempo, es decir, las variables de control y sus El efecto de interacción de no tuvo un impacto significativo en las variables observadas.
(2) Descomposición de la varianza de las variables observadas
En el análisis de varianza multifactorial, los cambios en los valores de las variables observadas se verán afectados por tres aspectos: Primero, el control las variables actúan de forma independiente El impacto de una sola variable de control se refiere al efecto independiente de una sola variable de control sobre las variables observadas; en segundo lugar, el impacto de la interacción de las variables de control se refiere al impacto de múltiples variables de control sobre las variables observadas cuando se combinan con; entre sí;
En tercer lugar, la influencia de factores aleatorios se refiere principalmente a la influencia causada por el error de muestreo. Con base en los principios anteriores, el análisis de varianza multifactorial descompone la variación total de las variables observadas en (tomando dos variables de control como ejemplo): SST=SSA+SSB+SSAB+SSE.
Entre ellos, SST es la variación total de las variables observadas; SSA y SSB son las variaciones causadas por los efectos independientes de las variables de control A y B respectivamente; A y B. ;SSE es la variación causada por factores aleatorios. Generalmente se denomina SSA+SSB+SSAB como efecto principal, SSAB como efecto de interacción N-WAY y SSE como efecto residual.
(3) Compare la proporción de cada parte de la desviación cuadrada total de las variables observadas y calcule el valor observado del estadístico de prueba y el valor P de probabilidad asociado.
El tercero Paso del análisis de varianza multifactorial El tercer paso es inferir si las variables de control y la interacción de las variables de control tienen un impacto significativo en las variables observadas comparando las proporciones de cada parte de la desviación cuadrada total de las variables observadas.
Es fácil entender que en la suma total de las desviaciones al cuadrado de las variables observadas, si SSA representa una gran proporción, significa que la variable de control A es uno de los principales factores que causan cambios en la variables observadas, y los cambios en las variables observadas pueden explicarse parcialmente por la variable de control A; por el contrario, si la proporción de SSA es pequeña, significa que la variable de control A no es el factor principal que causa cambios en las variables observadas; y los cambios en las variables observadas no pueden explicarse por la variable de control A. Lo mismo ocurre con SSB y SSAB.
En el análisis de varianza multifactorial, las variables de control se pueden dividir en dos tipos: efectos fijos y efectos aleatorios. Entre ellos, los efectos fijos generalmente significan que los distintos niveles de las variables de control pueden controlarse estrictamente y su impacto en las variables observadas es fijo. Los efectos aleatorios significan que los distintos niveles de las variables de control no pueden controlarse estrictamente y tienen un efecto fijo; Impacto fijo sobre las variables observadas. El impacto es aleatorio. En general, es difícil distinguir entre efectos fijos y efectos aleatorios.
Debido a la existencia de estos dos efectos, los modelos de análisis multifactorial de varianza también se dividen en modelos de efectos fijos y modelos de efectos aleatorios. Los dos modelos descomponen la variación de las variables observadas exactamente de la misma manera y la principal diferencia se refleja en la construcción del estadístico de prueba. El estadístico de prueba utilizado en el análisis de varianza multifactorial sigue siendo el estadístico F. Si hay dos variables de control A y B, normalmente corresponden a tres estadísticos de prueba F.
4. Dado un nivel de significancia, tome una decisión
Dado un nivel de significancia, compárelo con el valor P de probabilidad asociado de la estadística de prueba. En el modelo de efectos fijos, si el valor P de probabilidad asociado de FA es menor o igual al nivel de significancia dado, se debe rechazar la hipótesis nula y se considera que existe una diferencia significativa en la media general de las variables observadas en diferentes niveles de la variable de control A. Si el efecto no es igual a 0 al mismo tiempo, diferentes niveles de la variable de control A tienen un impacto significativo en la variable observada;
Por el contrario, si la variable que la acompaña La probabilidad de que el valor P de FA sea mayor que el nivel de significancia dado, no debe rechazarse la hipótesis nula, se cree que no existe una diferencia significativa en las medias generales de las variables observadas en diferentes niveles de la variable de control A. Cada efecto de la variable de control A es 0 al mismo tiempo. Los diferentes niveles de la variable de control A no tienen un impacto significativo en las variables observadas. Lo mismo se aplica a la inferencia de la interacción entre la variable de control B y A y B. En el modelo estocástico, primero debemos inferir si la interacción entre A y B es significativa y luego probar los efectos de A y B respectivamente.
Enciclopedia Baidu - Análisis de varianza
Enciclopedia Baidu - Análisis de varianza de dos factores
Enciclopedia Baidu - Análisis de varianza multifactorial