Al final y al comienzo del año, es muy necesario que las empresas tabacaleras pronostiquen las ventas de cigarrillos al organizar las tareas de venta de cigarrillos para el próximo año. Utilizar el modelo ARIMA para predecir las ventas de cigarrillos es un método muy útil.
El método ARIMA es un método eficaz para la previsión de series temporales. Para mejorar la precisión del pronóstico de ventas de cigarrillos, se propone un modelo de pronóstico de ventas de cigarrillos basado en ARIMA para lograr pronósticos de ventas de cigarrillos mensuales y trimestrales. Mediante análisis empírico, se demuestra que el modelo puede predecir bien las ventas totales de cigarrillos mensuales y trimestrales.
1. Premisa teórica e introducción del modelo
Las ventas de cigarrillos tienen las características de cambios de tendencia duales en series de tiempo, a saber, cambios de tendencia generales y fluctuaciones estacionales. Las características de la predicción de tendencia dual son la importancia del orden de los valores de observación, la correlación de los valores de observación anteriores y posteriores y su relación durante el mismo período, es decir, el punto de predicción tiene una fuerte correlación con los puntos de observación cercanos. entre sí, pero tiene una fuerte correlación con puntos de observación que están lejos unos de otros. Los métodos comúnmente utilizados para la predicción de tendencias duales incluyen la regresión lineal, las redes neuronales y el análisis de series temporales [1]. El método de análisis de series de tiempo puede analizar objetivamente las ventas de cigarrillos en función de datos históricos y puede lograr pronósticos estacionales y cíclicos de las ventas de cigarrillos. Los métodos tradicionales de análisis de series de tiempo, como la media móvil y el suavizado exponencial, a menudo afectan la precisión del pronóstico debido a errores de retraso. El modelo ARMA es el modelo más utilizado para describir secuencias aleatorias estacionarias y actualmente es el mejor método de predicción de series temporales aleatorias univariadas. Sin embargo, las series de tiempo real suelen ser no estacionarias, por lo que solemos utilizar el modelo ARIMA para analizar series de tiempo.
El método de modelado ARIMA de análisis de series temporales, también conocido como método Box-Jenkins, es un método de predicción de series temporales que lleva el nombre del estadístico estadounidense Geogre. E.P.Box y el estadístico británico Gwilym M.Jenkins Se basa principalmente en el análisis de series temporales y en la selección de un modelo apropiado para la predicción. El modelo ARIMA también se denomina modelo de media móvil integrada autorregresiva. La idea básica del método Box-Jenkins es utilizar la combinación lineal de los valores pasados y presentes de una serie de tiempo para predecir su valor futuro. Es decir, la secuencia de datos formada por el paso del tiempo se considera una secuencia aleatoria, y la serie de tiempo se considera un conjunto de variables aleatorias que solo dependen del tiempo t. La correlación o autocorrelación de este conjunto de variables aleatorias. indica la continuidad observada del desarrollo del objeto. Una vez que esta correlación se describe mediante un modelo matemático correspondiente, el valor futuro de la serie temporal se puede predecir a partir de los valores pasados y presentes [2].
La serie temporal consta de cuatro partes: tendencias de largo plazo, cambios estacionales, fluctuaciones cíclicas y cambios irregulares. Las series de tiempo son datos formados por la misma cosa o fenómeno en diferentes períodos, que reflejan el desarrollo y los cambios de las cosas y fenómenos a lo largo del tiempo.
El modelo ARIMA utiliza una gran cantidad de datos históricos para construir el modelo. Después de la identificación del modelo y la estimación de los parámetros, se determina un modelo matemático que pueda describir la serie temporal bajo estudio. Finalmente, a partir de este modelo se deriva un modelo de predicción para lograr el propósito de predicción. Hay tres formas básicas de modelos ARMA: modelo autorregresivo (AR), modelo de media móvil (MA) y modelo de media móvil autorregresiva (o modelo híbrido) [3].
1. Modelo autorregresivo AR(p)
Si la serie temporal {yt} satisface:
yt =φ1yt-1+…+φpyt-p+ εt (1).
Donde: {εt} es una secuencia de variables aleatorias distribuidas independientemente, y para cualquier t, E(εt)=0, var(εt)= > 0, se dice que la serie de tiempo {yt}; obedecer al modelo autorregresivo de orden P, denotado como AR(p). φ1,…,φp se denominan coeficientes autorregresivos.
Supongamos que Bk es un operador de retraso de k pasos, es decir, Bkyt=yt-1, entonces el modelo (1) se puede expresar como:
yt=(φ1B+…+φpBP )yt+εt
Supongamos que φ(B)=1-φ1B-…-φpBP, entonces el modelo (1) se puede expresar como:
φ(B)yt=εt
La condición para que AR(p) sea estacionario es que las raíces del polinomio del operador de retraso φ(B)=1-φ1B-...-φpBP estén fuera del círculo unitario, es decir, las raíces de φ(B)=0 son mayores que 1.
2. Modelo de media móvil MA(q)
Si la serie temporal {yt} satisface:
yt =εt–θ1εt-1–…–θqyt - q(2)
Se dice que la serie temporal {yt} obedece al modelo de media móvil de orden Q, denotado como MA(q). θ1,...,θq se denominan coeficientes de media móvil.
Si se representa mediante el operador de retraso Bk, asumiendo θ(B)=1-θ1B-…-θqBP, entonces el modelo (2) se puede escribir como:
yt=θ( B) εt
El modelo MA(q) es estacionario bajo cualquier condición.
3. Modelo de media móvil autorregresiva ARMA(p, q)
Si la serie temporal {yt} satisface:
yt =φ1yt-1+…+ φpyt-p+εt-–
Entonces se dice que la serie temporal {yt} obedece al modelo de media móvil autorregresiva de orden (p, q), que se registra como ARMA(p, q). φ1,...,φP se denominan coeficientes autorregresivos, θ1,..., θq se denominan coeficientes de media móvil.
Para el modelo ARMA(p, q), cuando q=0, el modelo es un modelo AR(p); cuando p=0, el modelo es un modelo MA(q).
Si se representa mediante el operador de retraso Bk, el modelo ARMA(p, q) se puede escribir como:
φ(B)yt=θ(B)εt
2. Marco de previsión de ventas de cigarrillos basado en el modelo ARIMA
1. Recopile datos de ventas de cigarrillos durante varios años.
2. Estabilidad de la secuencia de datos. La premisa básica para establecer un modelo ARMA es asegurar la estacionariedad de la serie temporal. El proceso de modelado ARIMA consiste en estabilizar la serie temporal no estacionaria y luego establecer un modelo ARMA. Una vez que se determinan p y q en el modelo, se puede determinar el modelo ARIMA. Por lo tanto, el primer trabajo analítico que se debe realizar es determinar los valores específicos de p y q, y luego realizar la estimación de parámetros y las pruebas de significancia del modelo ARMA (p, q). Finalmente, se utiliza el modelo de saliencia para predecir la serie temporal.
3. Calcule los coeficientes de autocorrelación y correlación parcial y compruebe si los datos preprocesados cumplen con los requisitos del modelado ARMA.
Logotipo 4.4. Modelo ARIMA. Con base en el truncamiento del coeficiente de autocorrelación (AC) y el coeficiente de correlación parcial (PAC), inicialmente determine a qué modelo pertenece la secuencia y el orden del modelo, y aplique el criterio AIC para determinar el orden del modelo.
5. Después de la estimación de parámetros, pruebe la aplicabilidad del modelo ARIMA, es decir, utilice ruido blanco para probar la secuencia residual del modelo. Si esto falla, se debe reordenar el modelo.
6. El uso del modelo ARIMA para predecir las ventas mensuales de cigarrillos puede proporcionar orientación para las ventas mensuales y trimestrales de cigarrillos de las empresas tabacaleras.
3. Análisis del modelo de venta de cigarrillos de una determinada empresa tabacalera.
1.
Los datos utilizados en este artículo son las ventas de cigarrillos de una empresa tabacalera en los últimos cuatro años, como se muestra en la Tabla 1.
Tabla 1 Datos históricos de ventas de cigarrillos
Figura 1 Curva de ventas de cigarrillos
En la Figura 1 se puede ver claramente que los datos de ventas de cigarrillos tienen un equilibrio general y fluctuaciones estacionales. tiene las características de cambios de tendencia dual en la serie temporal.
2. Estabilización de la serie de datos
Como se puede observar en la Figura 1, la serie de datos tiene una tendencia y es una secuencia no estacionaria que necesita estabilizarse. El diagrama de secuencia después de la diferencia de primer orden de los datos se muestra en la Figura 2.
Figura 2 Diagrama de secuencia después de la diferencia de primer orden
La Figura 2 muestra que la tendencia ha sido eliminada, pero aún es estacional, por lo que se realizan diferencias estacionales, como se muestra en la Figura 3. .
Figura 3. Diagrama de secuencia después de las diferencias estacionales
3. Calcule los coeficientes de autocorrelación y correlación parcial y verifique si los datos preprocesados cumplen con los requisitos del modelado ARMA.
El coeficiente de correlación y el coeficiente de correlación parcial de la serie después de la diferencia de primer orden y la diferencia estacional se muestran en la Figura 4.
Figura 4. Coeficientes de correlación y coeficientes de correlación parcial de series de diferencias estacionales.
Como se puede ver en la figura anterior, el coeficiente de autocorrelación de la serie temporal básicamente cae en el intervalo de confianza y gradualmente se acerca a cero. Se puede juzgar que la serie temporal es estable.
4.4. Identificación, estimación de parámetros y ensayo. Modelo ARMA:
Este orden está determinado por el principio AIC. El criterio AIC se denomina criterio de orden del modelo de identificación de información mínima.
La idea básica de este criterio es juzgar si el orden del modelo autorregresivo es apropiado en función del error de predicción del modelo. Si se ajusta un modelo autorregresivo aplicable a partir de una determinada secuencia, entonces el error de predicción obtenido al utilizar este modelo para predecir la secuencia en un paso debe ser mínimo. El modelo óptimo es logARIMA (0, 1, 2) (0, 1, 1) snoint.
Los diagramas ACF, PACF e IACF de los restantes términos del modelo LOGARIMA (0, 1, 2)(0, 1, 1) SNOINT son los siguientes:
Figura 5 Modelo LOGARIMA (0, 1, 2) (0, 1, 1) Gráficas ACF, PACF, IACF de los términos restantes de SNOINT.
Después de la estimación de parámetros y el ajuste del modelo, es necesario probar la aplicabilidad del modelo ARIMA, es decir, utilizar ruido blanco para probar la secuencia residual del modelo. Si la secuencia residual no es una secuencia de ruido blanco, significa que todavía hay información útil en la secuencia residual que no se ha extraído y es necesario volver a identificar el modelo.
Figura 6 LOGARIMA(0,1,2) (0,1,1) Gráfico de prueba de ruido blanco y raíz unitaria del término residual del modelo SNOINT.
Como se puede ver en la figura anterior, el término residual del modelo es ruido blanco y la información se extrae por completo.
Las estadísticas de ajuste del modelo son las siguientes:
Figura 7 modelo LOGARIMA (0, 1, 2) (0, 1, 1) Estadísticas de ajuste de SNOINT
Modelo Los parámetros estadísticos son los siguientes:
Figura 8 Parámetros estadísticos del modelo logARIMA(0,1,2) (0,1,1).
5. Utilice el modelo ARIMA para predecir los datos de ventas del 165438+octubre de 2009 al 65438+febrero de 2000.
El gráfico de pronóstico de tendencia de ventas de 165438+octubre 2009-2010 65438+febrero de 2009 es el siguiente:
Figura 9 Gráfico de pronóstico de ventas de 165438+octubre 2009-1febrero de 2009.
La previsión de ventas y el rango de previsión desde 165438+octubre de 2009 hasta 65438+2 de febrero de 2010 son los siguientes.
En resumen, el modelo de pronóstico de ventas de cigarrillos establecido por el método ARIMA puede predecir mejor la tendencia cambiante de las ventas mensuales totales de cigarrillos de diversas especificaciones y puede simular eficazmente las características estacionales, cíclicas y aleatorias de las ventas de cigarrillos. . Los datos del pronóstico se pueden utilizar como referencia para las ventas de cigarrillos mensuales y trimestrales.
[Referencias]
[1] Luo, Lv Yonggui, Modelo de pronóstico de ventas de cigarrillos mixtos basado en ARMA, Computer Application Research [J]. 2] Ruan Jing, análisis estadístico de SAS desde el nivel básico hasta el dominio [M], People's Posts and Telecommunications Press 2009
[3] Xu Guoqiang, Previsión estadística y toma de decisiones [M], Universidad de Finanzas de Shanghai. y Prensa Económica 2008