La estadística es una ciencia muy antigua. Generalmente se cree que su investigación teórica comenzó en la época de Aristóteles en la antigua Grecia y tiene una historia de más de 2.300 años. Surgió del estudio de cuestiones sociales y económicas. En el proceso de desarrollo de más de dos mil años, la estadística ha experimentado al menos tres etapas de desarrollo: "política de ciudad-estado", "aritmética política" y "ciencia del análisis estadístico". La llamada "estadística matemática" no es una disciplina nueva e independiente de la estadística. Concretamente, es el término general para todos los nuevos métodos de recopilación y análisis de datos formados en la tercera etapa del desarrollo de las estadísticas. La teoría de la probabilidad es la base teórica de la estadística matemática, pero pertenece a las matemáticas más que a la estadística. [1] No existe un punto divisorio obvio respecto de la etapa de "política de ciudad-estado", y la diferencia esencial no es grande.
La característica de la "Aritmética Política" es la combinación de métodos estadísticos con métodos de cálculo y razonamiento matemático. La forma de analizar los problemas sociales y económicos presta más atención a la aplicación de métodos de análisis cuantitativo.
En 1690, William Petty publicó el libro "Aritmética política", que marcó el inicio de esta etapa.
El método de William Petty para cuantificar los fenómenos sociales y económicos utilizando números, pesos y escalas es una característica importante de la estadística moderna. Por lo tanto, la "Aritmética política" de William Petty fue evaluada por generaciones posteriores de académicos como la fuente de la estadística moderna, y el propio William Petty también fue evaluado como el padre de la estadística moderna.
En el libro de Petty se utilizan tres tipos de cifras:
El primer tipo son cifras obtenidas de encuestas estadísticas y observaciones empíricas de fenómenos socioeconómicos. Debido a las limitaciones de las condiciones históricas, en el libro hay muy pocos datos obtenidos mediante estrictos estudios estadísticos y muchas cifras se basan en la experiencia.
La segunda categoría son los números calculados utilizando algún método matemático. Sus métodos de cálculo se pueden dividir en tres tipos: "métodos basados en valores medios"; el tercer tipo son los números ilustrativos utilizados para el razonamiento teórico. Petty llama a este tipo de razonamiento con números y símbolos "algoritmos algebraicos". En cuanto al método de uso de datos, las estadísticas en la etapa de "aritmética política" han reflejado claramente las características de "la ciencia y el arte de recopilar y analizar datos". Incluso los métodos estadísticos empíricos y los métodos de análisis teórico todavía están integrados. heredado. [2] La tendencia de combinar estadística y matemáticas en la etapa de "aritmética política" se convirtió gradualmente en "ciencia del análisis estadístico".
A finales del siglo XIX, se creó el "Compendio de condiciones nacionales". o "Condiciones nacionales" se establecieron en las universidades europeas. Los nombres de cursos como "Aritmética política" desaparecieron gradualmente y fueron reemplazados por "Ciencia del análisis estadístico". En ese momento, el contenido del curso "Análisis estadístico" seguía siendo el análisis y la investigación. de cuestiones sociales y económicas.
El curso "Ciencia del Análisis Estadístico" El surgimiento del curso fue el comienzo de la etapa de desarrollo de la estadística moderna. En 1908, Student (seudónimo William Sleey Gosset) publicó un artículo sobre. la distribución t, que fue un artículo que marcó una época en la historia del desarrollo estadístico. Fue pionero en el uso de muestras pequeñas en lugar del método de muestras grandes, creando una nueva era de la estadística. Fue el primer representante de la estadística moderna. Aplicó ampliamente la ciencia del análisis estadístico a las ciencias sociales, las ciencias naturales y otros campos de la ingeniería y las ciencias técnicas, porque estaba convencido de que la estadística podía utilizarse como método de investigación general para estudiar cualquier ciencia. p>
La teoría de la probabilidad, la base teórica de la estadística moderna, comenzó a estudiar el momento del juego, probablemente a partir de 1477. Los matemáticos llevaron a cabo investigaciones a largo plazo para explicar las leyes generales que gobiernan el azar y gradualmente formaron el marco teórico de Teoría de la probabilidad. Basado en el desarrollo posterior de la teoría de la probabilidad, a principios del siglo XIX, los matemáticos establecieron gradualmente la teoría del error de observación, la teoría de la distribución normal y el método de mínimos cuadrados. Por lo tanto, los métodos estadísticos modernos tienen una base teórica relativamente sólida. : la ciencia de recopilar, procesar, analizar e interpretar datos y extraer conclusiones de los datos.
Estadística descriptiva: métodos estadísticos para recopilar, procesar y describir datos de investigación.
Estadística inferencial: método estadístico que estudia cómo utilizar datos muestrales para inferir características de la población.
Variable: Propiedad que da un resultado diferente cada vez que se observa.
Variables categóricas: Las observaciones se expresan como variables de un determinado tipo.
Variable de rango: también llamada variable categórica ordenada, los resultados de la observación muestran algún tipo de variable ordenada.
Variables métricas: También conocidas como variables cuantitativas, las observaciones son variables numéricas.
Media: La media es el valor promedio, a veces especialmente la media aritmética. Este es un promedio calculado utilizando otros métodos. La solución es sumar todos los números y luego dividir por la cantidad de números. Este es un método para medir la tendencia central o media.
Mediana: Selecciona el número del medio. Para encontrar la mediana, primero debes ordenar los números de pequeño a grande y luego mirar el número del medio.
Moda: La moda es el número que aparece con mayor frecuencia en el conjunto de datos. Para aplicar la estadística a problemas científicos, industriales y sociales, partimos de una matriz de estudio. Podría ser la gente de un país, el cristal de una piedra o los bienes producidos en una fábrica en particular. Una matriz puede incluso constar de múltiples observaciones idénticas; las matrices de dichos conjuntos de datos se denominan series de tiempo.
Por razones prácticas, en lugar de estudiar cada dato de la matriz, elegimos estudiar un subconjunto de la matriz. Este subconjunto se llama muestra. Las muestras recopiladas de un experimento diseñado con cierta experiencia se denominan datos. Los datos son objeto de análisis estadístico y se utilizan para dos fines relacionados: descripción e inferencia. La estadística descriptiva aborda preguntas narrativas: ¿Se pueden resumir los datos de manera efectiva, ya sea matemática o gráficamente, para representar las propiedades de la matriz? Las descripciones matemáticas básicas incluyen la media y la desviación estándar. Los resúmenes de imágenes contienen una variedad de tablas y gráficos.
La estadística inferencial se utiliza para modelar datos en datos, calcular sus probabilidades y hacer inferencias sobre matrices. Esta inferencia se puede presentar a través de respuestas a preguntas de verdadero/falso (prueba de hipótesis), estimación de características numéricas (estimación), predicción de observaciones futuras, predicción de correlaciones (correlación) o modelado de relaciones (regresión). Otras técnicas de modelado incluyen análisis de varianza (ANOVA), series temporales y minería de datos.
Los conceptos relacionados son particularmente dignos de discusión. El análisis estadístico de un conjunto de datos puede mostrar que dos variables (dos atributos en una matriz) tienden a variar juntas, como si estuvieran relacionadas. Por ejemplo, una revista de investigación sobre los ingresos de las personas y la edad al momento de su muerte podría encontrar que los pobres tienden a vivir vidas más cortas en promedio que los ricos. Estas dos variables se llaman correlaciones. Pero, de hecho, no podemos inferir directamente que exista una relación causal entre estas dos variables; consulte Inferencia de causalidad correlacionada (falacia lógica).
Si la muestra es representativa de la matriz, entonces las inferencias y conclusiones extraídas de la muestra se pueden generalizar a toda la matriz. El mayor problema es decidir si la muestra es suficientemente representativa de toda la matriz. La estadística proporciona muchas formas de estimar y corregir la aleatoriedad (error) en los procesos de recolección de muestras y datos, al igual que los experimentos diseñados empíricamente mencionados anteriormente. Ver diseño experimental.
Para entender la aleatoriedad o probabilidad es necesario tener conceptos matemáticos básicos. La estadística matemática (a menudo llamada teoría estadística) es una rama de las matemáticas aplicadas que utiliza la teoría de la probabilidad para analizar y verificar las bases teóricas de la estadística.
Cualquier método estadístico es válido sólo si el sistema o matriz satisface los supuestos básicos de la metodología. El mal uso de las estadísticas puede conducir a errores graves en la descripción o inferencia, que pueden afectar la política social, la práctica médica y la confiabilidad de los planes de generación de energía nuclear o puente.
Incluso cuando las estadísticas se aplican correctamente, los resultados pueden ser difíciles de expresar para los no expertos. Por ejemplo, cambios significativos en las estadísticas pueden ser causados por variables aleatorias en la muestra, pero esta importancia puede ser contraintuitiva para el público. Frente a la información obtenida citando datos estadísticos en la vida diaria, las personas necesitan algunas habilidades (o dudas) estadísticas. Escalas de Medición
Estadística 1 * * *Existen cuatro escalas de medición o cuatro métodos de medición. Estas cuatro medidas (nominal, ordinal, intervalos iguales y proporciones iguales) tienen diferentes aspectos prácticos en el proceso estadístico.
Por definición, una medida de ratio es cero y la distancia entre los datos es igual.
La distancia entre los datos de medición de intervalos es igual y definida, pero su valor cero no es absoluto sino personalizado (como la medición de inteligencia o temperatura);
El significado de las medidas ordinales es no se refleja en su valor, sino en su orden;
El valor medido de medida nominal no tiene significado cuantitativo.
A continuación se enumeran algunos métodos y pasos de verificación estadística bien conocidos para validar datos experimentales.
Prueba de diferencias mínimas significativas de Fisher (Prueba de diferencias menos significativas de Fisher)
Prueba "t de Student"
Prueba U de Mann-Whitney
Análisis de regresión (análisis de regresión)
Correlación (correlación)
Coeficiente de correlación momento-producto de Pearson.
Coeficiente de correlación de rangos de Spearman (coeficiente de correlación de rangos de Spearman)
Distribución chi-cuadrado
El período de fundación
El alemán Shi Litz dijo una vez : "La estadística es historia dinámica y la historia es estadística estática". Se puede observar que el surgimiento y desarrollo de las estadísticas están estrechamente relacionados con el desarrollo productivo y el progreso social.
El germen de la estadística se originó en Europa. La mitad del siglo XVII hasta mediados del siglo XVIII fue el periodo fundacional de la estadística. Durante este período, la teoría estadística formó inicialmente ciertas facciones académicas, incluidas principalmente la Escuela de Tendencia Nacional y la Escuela de Aritmética Política.