Estadística inferencial (II)-Prueba de hipótesis

La prueba de hipótesis es un método de verificación probabilístico basado en lógica negativa.

Lógica negativa: si a-> B, entonces ~ b-> ~A. Por ejemplo, en circunstancias normales, si una persona es un hombre (A), necesita ir al baño de hombres ( B), si no vas al baño de hombres (~B), no eres un hombre (~A).

Se deben tener en cuenta dos puntos: 1) Ni A ni B en lógica negativa son suficientes y necesarios, por lo que existe una situación en la que ~B no puede derivarse de ~A, lo cual debe considerarse en función de la situación actual; 2) La lógica negativa y la Reductio ad absurdum son muy similares, pero existen diferencias de naturaleza. La diferencia es que la reducción al absurdo presupone que ~B definitivamente puede conducir a ~A, pero en la mayoría de los casos puede considerarse la misma idea.

La prueba de hipótesis también se aplica al principio de ocurrencia de eventos de pequeña probabilidad, es decir, los eventos de pequeña probabilidad son un tipo de evento con una probabilidad de ocurrencia muy pequeña (cercana a 0). Entonces es casi imposible que suceda en una prueba (muestreo), pero es inevitable en múltiples pruebas (muestreo).

Prueba de hipótesis: Se supone que las características de la muestra permiten estimar con seguridad los parámetros de la población.

¿Adónde ir? Tomando como ejemplo la prueba t (independencia, normalidad y homogeneidad de varianzas), presentamos los tres pasos de la prueba de hipótesis:

Paso 1: Proponer (inferencia) hipótesis.

La prueba de hipótesis requiere primero probar la hipótesis, incluyendo y. Se llama hipótesis nula y a menudo se traduce en hipótesis nula, hipótesis nula, etc. , esto es en lógica negativa; para hipótesis alternativas, la traducción china tiene hipótesis alternativas e hipótesis opuestas, que es ~A en lógica negativa. y es un par de eventos mutuamente excluyentes que constituyen el caso completo de la estimación de la población por parte de la muestra.

Entonces, para determinar el contenido de una hipótesis, generalmente se deben seguir ciertos principios: tratar el contenido irrelevante, inválido, reconocido, evidente por sí mismo y que cumple con las reglas como distintivo, válido y necesario. Probado , contenido que rompe las reglas como contenido. Aquí no profundizaremos en cómo se forma el principio, sino que veremos la aplicación a través de un ejemplo.

Tomemos como ejemplo el peso de la bolsa de patatas fritas. Se sabe que el peso de una bolsa de patatas fritas de una determinada marca está marcado en el embalaje exterior. Ahora el peso medio de la bolsa de la muestra es. obtenidos a través de una encuesta por muestreo. Inevitable por error de muestreo. Ahora necesitamos probar si el verdadero peso promedio de la bolsa de papas fritas es igual a 0. Proponer una hipótesis:

: ; (es decir, a)

? : . (es decir, ~A)

Este es un estándar de producción predeterminado, planificado y generalmente aceptado, al igual que lo es el contenido. De hecho, no hay necesidad de preocuparse por los principios relevantes, simplemente haga lo contrario.

Paso 2: Calcular la probabilidad

El segundo paso de la prueba de hipótesis es calcular la probabilidad, entonces, ¿qué probabilidad se calcula? Esto requiere una respuesta para determinar qué son B y B. Respondamos primero:

b: el valor promedio de la muestra obtenida mediante muestreo es una situación normal, no un evento de probabilidad pequeña;

~B: el valor promedio de la muestra obtenida por muestreo es un evento de pequeña probabilidad.

Entonces se forma la lógica negativa completa en la prueba de hipótesis:

a- gt;b: Si la hipótesis nula es verdadera, entonces el resultado de un muestreo no debería ser una probabilidad pequeña evento.

? ~ B- gt; ~ A: Si el resultado de un muestreo es un evento de probabilidad pequeña, entonces la hipótesis nula no es cierta.

Ahora tomemos el peso de la bolsa de papas fritas como ejemplo para ilustrar esta lógica: en primer lugar, debe quedar claro que la media muestral y la media poblacional no serán iguales, porque el error de muestreo es inevitable. , es decir, no se puede inferir mediante comparación directa el verdadero peso total de la bolsa de papas fritas, por lo que es necesario cambiar la probabilidad del ángulo. Si el promedio de la población es realmente cierto, entonces el promedio de la muestra obtenido mediante muestreo debería ser un resultado normal, y lo "normal" aquí puede ocurrir en un muestreo, en lugar de con una pequeña probabilidad, siempre que la probabilidad de este resultado sea calculado, Inferir si la media de la población es.

Entonces puede responder la pregunta "¿Calcular la probabilidad de qué?": Calcule la probabilidad P del resultado del muestreo bajo la premisa de la hipótesis nula, pero P es en realidad una probabilidad condicional, es decir, P (resultado del muestreo | cero Se establece el supuesto).

El tercer paso: inferencia probabilística

El tercer paso de la inferencia probabilística es juzgar el "rechazo" o la "aceptación" de la hipótesis en función de los resultados de probabilidad calculados. El proceso de razonamiento se muestra en la siguiente figura:

El razonamiento probabilístico se basa en la lógica deductiva anterior. Si la probabilidad condicional de la muestra en el evento de muestreo es mayor que el umbral () del evento de probabilidad pequeña, significa que B está establecido y hay a->b, así que no lo rechace, si es así; El evento de muestreo se considera un evento de pequeña probabilidad, es decir, se establece ~B, entonces ~ b-> ~A, así que rechace, acepte.

En este punto, se supone que todo el proceso de inspección está básicamente completado.

¿Por qué los resultados de las pruebas utilizan "aceptar" y "rechazar" en lugar de "verdadero" y "falso"?

Respuesta: Dado que no se pueden obtener los datos generales, nunca es posible conocer la verdadera situación de los parámetros generales, por lo que no hay duda de "verdadero" o "falso". Tomemos como ejemplo las patatas fritas. El peso indicado aquí es sólo un peso predeterminado, que es esencialmente un valor esperado, no un valor real. La mayoría de las pruebas hipotéticas son pruebas de valores esperados.

? ¿Cuál es la diferencia entre "aceptar", "rechazar" y "no rechazar"?

? En primer lugar, cuando lo miras, significa que bajo la premisa de la hipótesis nula, no la rechazarás en este momento. Sin embargo, como no se puede conocer el valor real del parámetro general, si es lo suficientemente pequeño, se puede obtener y puede tener innumerables valores. La hipótesis nula: es sólo una de las innumerables situaciones posibles, por lo que es imposible determinar cuál. la situación real es, y sólo se puede “no rechazar” y “aceptar”. Pero muestra que la hipótesis nula es una situación casi imposible, y puede estar relativamente seguro de que el valor verdadero general no es este, por lo que puede "evitarlo".

El segundo paso de la prueba de hipótesis es calcular la probabilidad. La probabilidad aquí es en realidad el valor. La prueba de hipótesis se juzga comparando la relación entre el valor y el valor. valor es en realidad cero. Suponga que el valor estadístico bajo la distribución normal, como se muestra a continuación, el valor es el área del área verde a la izquierda:

Por lo tanto, el segundo paso de la prueba de hipótesis. No solo puede comparar la suma de los valores de probabilidad, sino también comparar los valores y juzgar. Cuando el valor está fuera, significa, o hay, entonces rechazar y aceptar cuando el valor está dentro, significa que hay, por lo que no hay rechazo.

La siguiente figura muestra los tres conjuntos de oposiciones /-2.58, /-1.96, /-1.645 como los límites de juicio de la prueba bilateral. Los tres conjuntos de límites corresponden a la eliminación de 0,01, 0,05 y 0,1 respectivamente, y los dos lados fuera del límite son regiones de rechazo.

De hecho, no existen regulaciones estrictas sobre el valor de "" en el mundo académico. Hasta ahora se acostumbraba tomar 0,01, 0,05 o 0,1, siendo 0,05 el caso más común. En cuanto al origen de 0,05, una afirmación más convincente es que la probabilidad de estar dentro de 4 veces la desviación estándar de la distribución normal estándar (/-1,96 es aproximadamente /-2 en la figura anterior) es aproximadamente 0,95 (en realidad será más grande), desde El rango y la probabilidad son fáciles de calcular y recordar, y el espacio de rechazo de 0,05 es suficiente para garantizar la exactitud de la prueba de hipótesis.

Sin embargo, utilizar 0,01, 0,05 y 0,1 como base para el juicio es arbitrario y conlleva un cierto riesgo de error en los resultados de la prueba de hipótesis, es decir, error tipo I y error tipo II.

Un tipo de error es el falso rechazo, es decir, el “rechazo de la verdad”. En la prueba de hipótesis, el criterio es el rechazo, por lo que la probabilidad de error es . Un error tipo I ocurre cuando ocurre un evento de pequeña probabilidad en una muestra y desafortunadamente se elimina por error.

El segundo tipo de error es rechazar incorrectamente, es decir, la "falacia de aceptación", o más exactamente la "falacia de no rechazar", y la probabilidad del error generalmente se escribe como . Sin embargo, se sabe de antemano que la probabilidad de cometer un error de tipo 1 es 0, mientras que un error de tipo 2 sólo puede obtenerse calculando el valor de verdad general. En la práctica, el cálculo de la media poblacional suele sustituirse por la media muestral. Tomando como ejemplo el peso de la bolsa de papas fritas, la probabilidad de cometer un error de segunda clase es un valor que hace que la probabilidad de la región de rechazo sea cero.

Explicación detallada de la siguiente figura:

El escenario que utiliza el peso de la bolsa de papas fritas, Figura 1 (Figura 1), se basa en la distribución de probabilidad a la que obedece la media muestral. cuando se establece la hipótesis nula. En este momento, la media de distribución es que la línea continua azul es un par de valores t correspondientes a la prueba de dos caras, luego el área amarilla a ambos lados de la línea azul es el área de rechazo con un área de .

La Figura 2 (Figura 2) muestra la distribución de probabilidad a la que obedece la media muestral cuando la media poblacional de la muestra es realmente 0. 438 0 en la Figura 65 también corresponde a un área en la distribución en la Figura 2, es decir, el área verde. La probabilidad de esta parte del área, es decir, el área.

Entonces, ¿cuál es el significado práctico de la armonía? Primero, si el promedio general de la muestra es (ver Figura 1), entonces es probable que el resultado del muestreo caiga en el área entre las dos líneas azules continuas, pero desafortunadamente este resultado del muestreo cae en la región de rechazo, por lo que se rechaza. Esto es "rechazo de la verdad". Obviamente, cuanto mayor es la región de rechazo, más probable es que se "rechace verdadero", por lo que el área de la región de rechazo es el error de "rechazo de verdad", que es la probabilidad del primer tipo de error.

Mire de nuevo: si la media general de la muestra es en realidad una suma), la hipótesis nula debe rechazarse en este momento. Sin embargo, la distribución media general en la Figura 1 coincide con la Figura 2, es decir, el área roja en la Figura 1 y el área verde en la Figura 2** usan el mismo intervalo de valor t (abscisa), lo que significa que incluso si la media general es 0, todavía es posible La media poblacional cae en la región de no rechazo y el resultado no es rechazo. Este es un error de tipo 2. La probabilidad de que esto suceda se muestra en el gráfico.

También se puede ver claramente en la figura anterior que en el mismo muestreo (tamaño de muestra fijo, desviación estándar fija), la suma es una relación de compensación (muévase para ver los cambios de área del rojo y áreas verdes).

Además, según las características del muestreo, a medida que aumenta el tamaño de la muestra, la desviación estándar continúa disminuyendo y la curva de distribución normal se estrechará gradualmente, lo que puede reducir la suma al mismo tiempo.

La estimación de parámetros y la prueba de hipótesis son partes importantes de la estadística inferencial y están esencialmente interconectadas:

La estimación de parámetros consiste en examinar si la distancia entre la media poblacional y la media muestral es dentro Dentro del rango de 1.96SE, un nivel de confianza de 95 representa la probabilidad de estar en lo cierto.

La prueba de hipótesis consiste en probar si la distancia desde 0 excede 1,96. El nivel de significancia es 1, el nivel de confianza después de convertirlo en un valor numérico o en un valor numérico (es decir, la estadística de muestra está estandarizada). según la distribución muestral).

src="/style/tongji.js">