El modelado estadístico es un proceso que utiliza software de análisis estadístico informático como herramienta, utiliza varios métodos de análisis estadístico para establecer modelos estadísticos y explora y procesa datos por lotes. Se utiliza para revelar los factores detrás de los datos y. Interpretar los fenómenos económicos, o hacer predicciones o juicios sobre el desarrollo económico y social. Con la rápida popularización y el amplio desarrollo de la tecnología informática y de redes, nos enfrentamos al desafío de la explosión de datos e información. Cómo convertir los datos de forma rápida y eficaz en información, conocimiento e inteligencia es una cuestión importante a la que se enfrentan los estadísticos. El modelado estadístico combina a la perfección métodos estadísticos y tecnología informática para impulsar el pensamiento estadístico orientado por el análisis de datos, descubrir y extraer las leyes detrás de los datos y proporcionar mejor y más información estadística para el desarrollo económico y social.
Los temas de competencia generalmente provienen de problemas prácticos apropiadamente simplificados en las ciencias sociales, económicas y de gestión. No es necesario que los estudiantes dominen de antemano conocimientos profesionales profundos, solo necesitan aprender el contenido básico de la estadística, dominar los métodos de análisis estadístico y tener cierta experiencia laboral en estadística. Las preguntas son muy flexibles y permiten a los concursantes utilizar sus habilidades creativas. Los participantes deben completar un documento (es decir, una hoja de respuestas) que incluya los supuestos, el establecimiento y la solución del modelo, el diseño y la implementación informática del método de cálculo, el análisis y prueba de los resultados y la mejora del modelo según el tema. requisitos. Los premios del concurso se basan en la solidez de las suposiciones, la creatividad en el modelado, la corrección de los resultados y la claridad de la redacción.
Echemos un vistazo a qué es el modelado estadístico a partir del siguiente ejemplo.
Caso de estudio: ¿Qué conclusiones se pueden extraer de los datos de accidentes de tráfico?
Datos básicos: Datos de accidentes de tráfico en diversas provincias, municipios y comunidades autónomas desde la reforma y apertura. Los datos deben incluir vehículos de motor (mercancías, autobuses, automóviles, vehículos agrícolas, tractores, motocicletas y vehículos de ingeniería, etc.), vehículos no motorizados (bicicletas, triciclos), otros (como bicicletas eléctricas, triciclos motorizados, aunque pueden ser ilegal), vehículos discapacitados, vehículos de tracción animal, peatones, etc. ;Los datos también deben incluir el grado de accidente, el número de accidentes, el número de víctimas mortales, los daños materiales, el número de heridos, etc. Ocupación, edad, experiencia de conducción, nivel educativo, si conduce bajo los efectos del alcohol (¡muy importante!), si conduce fatigado, si utiliza un teléfono móvil, velocidad del vehículo, condiciones de la carretera (calles, carreteras normales). , carreteras niveladas, autopistas), período de tiempo del accidente, etc. (Estos son registros estándar del departamento de control de tráfico). Los datos deben cubrir al menos 10 años (se prefieren datos mensuales).
Datos complementarios: Datos económicos de los años correspondientes para cada provincia, ciudad y comunidad autónoma, incluidos diversos kilometrajes por carretera y distintos números de vehículos de motor.
Preguntas:
1. Descubra la probabilidad (y los factores que influyen) de varios accidentes para varios vehículos y las variables que influyen en el número de estos accidentes (como la edad, si beber alcohol, zonas montañosas o centro de la ciudad, período de tiempo, qué tipo de carreteras, tipos de vehículos, etc. ).
2. Descubra qué factores (variables) tienen más probabilidades de causar accidentes y qué factores ( variables) tienen más probabilidades de causar lesiones personales importantes. Qué factores (variables) causan el mayor daño a la propiedad.
3. Conocer las características de la accidentabilidad de cada provincia, ciudad y comunidad autónoma, clasificarlas según patrones de accidentabilidad y compararlas según clasificación económica. Explicar la relación entre los accidentes de tráfico y el desarrollo económico.
4. Encuentre tendencias de accidentes locales y nacionales y cómo estas tendencias se relacionan con la economía (incluidos los kilómetros de carretera, la cantidad de vehículos de motor, etc.) y prediga accidentes futuros.
5. Clasificar provincias, ciudades y comunidades autónomas en función de diversas variables relacionadas con los accidentes de tráfico.
Requisito: Todo se basa en datos. Cualquier método estadístico empleado debe explicar las condiciones y los supuestos. Cualquier resultado de salida debe explicarse y explicarse.
Con base en los casos anteriores, no es difícil llegar a una conclusión: en cierto sentido, el modelado estadístico es una composición proposicional con las siguientes características:
Primero, el modelado estadístico es basado en la economía Basado en la situación real del desarrollo social, descubra las tendencias de desarrollo y las leyes de las cosas. Sin este punto, el modelado estadístico pierde su significado.
En segundo lugar, el modelado estadístico comienza a partir de datos, descubre la relación entre los datos y utiliza datos para hablar. Esta es la característica más importante del modelado estadístico.
En tercer lugar, el modelado estadístico combina eficazmente métodos de análisis estadístico con tecnología informática, incluida la recopilación de datos y el uso de software de análisis estadístico para analizar los datos.
En cuarto lugar, el modelado estadístico implica muchos aspectos, como la recopilación, clasificación y análisis de datos, y requiere habilidades integrales por parte del modelador.
2. El proceso de modelado estadístico
(1) Aclarar el problema. El modelado estadístico enfatiza la orientación del problema, por lo que primero se debe aclarar el problema que debe resolverse.
(2) Recopilar información: sobre la base de aclarar el problema, de acuerdo con los requisitos del tema, recopile y organice diversa información necesaria de las bases de datos disponibles.
(3) Supuestos del modelo: utilice métodos de análisis estadístico para hacer supuestos necesarios y razonables sobre el problema, de modo que se resalten las características principales del problema y se ignoren los aspectos secundarios del problema.
(D) Construcción del modelo: basándose en los supuestos hechos y la relación entre las cosas, construya la relación entre varias cantidades, convierta el problema en un problema de análisis estadístico y preste atención al uso del análisis estadístico apropiado tanto como sea posible. como sea posible Modelos y métodos.
(5) Solución modelo: Utilizar el modelo establecido para realizar cálculos y obtener alguna información relacionada con el problema. Si es necesario, se puede simplificar aún más el problema o hacer más suposiciones.
(6) Análisis de modelos: Analiza la información obtenida para formarse un juicio, prestando especial atención a si los resultados obtenidos son estables cuando los datos cambian.
(7) Inspección de resultados: analizar la importancia práctica de los resultados obtenidos y compararlos con la situación real para ver si son consistentes con la realidad. Si no son ideales, debemos revisar, complementar los supuestos o remodelarlos.
(8) Redacción de una tesis: Formar una tesis basada en lo anterior, que debe incluir la descripción del problema, la descripción de la hipótesis, el proceso de construcción del modelo, los resultados de la solución del modelo, las principales conclusiones y la evaluación de las conclusiones.
3. Contenido básico de los artículos de modelización estadística
El artículo enviado debe incluir tres partes:
(1) Título y parte del resumen
Tema: escriba un tema más preciso
: 200-300 palabras, incluidas las características principales del modelo, los métodos de modelado y los resultados principales.
(2) Parte principal
1. Hacer preguntas y analizar problemas.
2. Construcción del modelo:
(1) Proponer hipótesis, definir conceptos e introducir parámetros
(2) Establecimiento del modelo; p >(3)Solución modelo.
3. Diseño de métodos de cálculo e implementación informática.
4. Principales conclusiones o hallazgos.
5. Análisis y pruebas de resultados.
6. Discusión - las ventajas y desventajas del modelo y la importancia de los resultados.
7.
(3) Apéndice
Programa de cálculo, diagrama de bloques.
Diversos procesos de resolución de cálculos y cálculo de resultados intermedios.
Varios gráficos y tablas.
Es difícil juzgar si es difícil o no, si es fácil o no, y cada estándar exacto es difícil de juzgar. Sin embargo, lo cierto es que es fácil aprender pero difícil no aprender. Espero que te anime.