Distribución normal
Si la variable aleatoria X obedece a la distribución normal con expectativa matemática μ y varianza σ 2, se registra como N(μ, σ 2). La función de densidad de probabilidad es una distribución normal cuyo valor esperado μ determina su posición y su desviación estándar σ determina la amplitud de la distribución.
Cualquier variable aleatoria
Reglas de distribución del área bajo la curva normal
Distribución t
Se utiliza para estimar la media de una pequeña muestra de una población con distribución normal. y varianza desconocida, es decir, t La distribución [fórmula] obedece a los grados de libertad v=n-1.
Si se conoce la varianza poblacional, entonces [fórmula] obedece a la distribución normal estándar.
Distribución t
Prueba t
Prueba t de muestra única
Prueba t de muestras pareadas
Dos muestras independientes Prueba t de muestra
Prueba T' cuando la varianza es desigual (para muestras grandes, puede usar el estadístico Z para realizar la prueba, y Z obedece a la distribución normal estándar).
prueba f
Prueba de homogeneidad de varianzas: inferir si las varianzas de las dos poblaciones son iguales a partir de las varianzas de las dos muestras.
Análisis de varianza: Compara medias muestrales múltiplos (k > 2). Incluyendo: análisis de varianza de diseño completamente al azar, diseño de bloques aleatorios y análisis de varianza de otros diseños (diseño factorial, diseño de medidas repetidas).
Prueba q
Comparación por pares de medias de múltiples muestras
Prueba de chi-cuadrado
Prueba de homogeneidad de varianzas en múltiples grupos de datos
Prueba de chi-cuadrado para datos de cuatro celdas, prueba de chi-cuadrado para datos de cuatro celdas pareadas
Prueba de chi-cuadrado para datos de la tabla de contingencia R*C
Prueba de suma de rangos no paramétrica (utilizada cuando se desconoce la distribución general de los datos)
Prueba de rangos con signo para datos de diseño pareados: utilice el estadístico de prueba T cuando el número de muestras sea pequeño y utilice el estadístico de prueba Z cuando el número de muestras es grande.
Prueba de suma de rangos para comparación de dos muestras independientes: estadístico de prueba t o z.
Prueba de suma de rangos para comparación de múltiples muestras independientes: estadístico de prueba h.
Las características de la distribución de los datos se pueden describir desde tres aspectos: tendencia central, tendencia de separación y forma de distribución.
1. El índice promedio es un indicador que refleja el nivel general o la tendencia central de la distribución. Hay dos indicadores promedio que miden las tendencias de concentración: el promedio de ubicación y el promedio numérico. La media posicional es un valor representativo determinado en función de la posición del valor de la variable. Los más utilizados son: moda y mediana. La media numérica es el promedio, que es el promedio calculado sobre todos los datos de la población para reflejar el nivel general de todos los datos. Las más utilizadas incluyen la media aritmética, la media armónica, la media geométrica y la media potencia.
2. El índice de variación es un indicador utilizado para describir la variación o dispersión de la distribución global. Los indicadores para medir la desviación de la tendencia incluyen: rango, diferencia de medias, rango intercuartil, varianza y desviación estándar y coeficiente de dispersión. La desviación estándar es la raíz cuadrada de la varianza, que es la raíz cuadrada de la dispersión al cuadrado de cada valor de variable y la raíz cuadrada aritmética de la media aritmética en la población. El coeficiente de dispersión es la relación entre cada índice de dispersión y su media aritmética correspondiente.
3. El momento, la asimetría y la curtosis son indicadores que reflejan el patrón de distribución general. Los momentos se utilizan para reflejar las características morfológicas de la distribución de datos, también conocidas como diferencias dinámicas. La asimetría refleja la dirección y el grado de asimetría en la distribución de datos. La curtosis se refiere a la pendiente o convexidad de un gráfico de distribución de datos.