Modelo de análisis de series temporales: modelo ARIMA

Nombre: Che Wenyang ID de estudiante: 16020199006

Introducción a Embedded Cow: ¿Qué es el modelo ARIMA?

Niu Nose integrado: ARIMA

Niu integrado P: ¿Dónde se puede aplicar el modelo ARIMA específicamente?

Texto de la vaca en mosaico:

1. Propósito de la investigación

El método econométrico tradicional es un modelo basado en la teoría económica, que se utiliza para describir la relación entre variables. Sin embargo, la teoría económica suele ser insuficiente para proporcionar una explicación rigurosa de las relaciones dinámicas entre variables, y las variables endógenas pueden aparecer tanto en el extremo izquierdo como en el derecho de la ecuación, lo que hace que la estimación y la inferencia sean más complejas. Para resolver estos problemas ha surgido una clase de modelos, como el modelo vectorial autorregresivo (VAR) y el modelo vectorial de corrección de errores (VEC), que utilizan métodos no estructurados para establecer la relación entre variables.

En el modelo de regresión clásico, el análisis de regresión se utiliza principalmente para establecer la relación funcional (relación causal) entre diferentes variables para examinar la relación entre cosas. Este caso discutirá cómo usar los datos de series de tiempo en sí para construir un modelo para estudiar los patrones de desarrollo de las cosas y hacer predicciones sobre el desarrollo futuro de las cosas en base a esto. La importancia de estudiar datos de series temporales: en realidad, a menudo es necesario estudiar las leyes del desarrollo y cambio de las cosas a lo largo del tiempo. Esto requiere estudiar los registros históricos del desarrollo pasado de esta cosa para obtener las leyes de su propio desarrollo. Muchos problemas de la realidad, como las fluctuaciones de las tasas de interés, los cambios en los ingresos y diversos índices que reflejan el mercado de valores, generalmente pueden representarse mediante datos de series temporales. A través del estudio de estos datos, se pueden descubrir los patrones cambiantes de estas variables económicas (para algunas variables, hay demasiados factores que afectan su desarrollo y cambios, o los datos que afectan principalmente a las variables son difíciles de recopilar, por lo que es Es difícil construir un modelo de regresión para descubrir sus reglas de cambio y desarrollo. En este momento, el modelo de análisis de series de tiempo muestra sus ventajas, porque este tipo de modelo no necesita establecer un modelo de relación causal, solo se requieren los datos de sus variables. ), y dicho método de modelado pertenece al ámbito de la investigación de series de tiempo. En el análisis de series de tiempo, el modelo ARIMA es el modelo más típico y comúnmente utilizado.

2. El principio del modelo ARIMA

1 y el significado de ARIMA. ARIMA consta de tres partes, a saber, AR, I y MA. ar-significa automático? Regresión, es decir, modelo autorregresivo; I: representa integral, es decir, orden entero. Un modelo de series de tiempo debe ser estacionario para establecer un modelo econométrico, y el modelo ARIMA como modelo de series de tiempo no es una excepción. Por lo tanto, primero realizamos una prueba de raíz unitaria en la serie de tiempo. Si es una secuencia no estacionaria, debe convertirse en una secuencia estacionaria mediante diferencias. Después de varias diferencias, se denomina entero de varios órdenes. ma- representa la media móvil, es decir, el modelo de media móvil. Se puede ver que el modelo es en realidad una combinación del modelo AR y el modelo MA.

La diferencia entre el modelo ARIMA y el modelo ARMA: el modelo ARMA se establece para series temporales estacionarias. Los modelos ARIMA están diseñados para modelar series temporales no estacionarias. En otras palabras, para establecer un modelo ARMA de una serie temporal no estacionaria, es necesario convertirlo en una serie temporal estacionaria mediante diferencia y luego establecer un modelo ARMA.

2. El principio del modelo ARIMA. Como se mencionó anteriormente, el modelo ARIMA es en realidad una combinación del modelo AR y el modelo MA.

La forma del modelo AR es la siguiente:

Entre ellos, el parámetro es una constante, que es el coeficiente del modelo autorregresivo de orden y es el orden de rezago del modelo; modelo autorregresivo; es un valor medio de 0 y una varianza de una secuencia de ruido blanco de 0. Símbolo de modelo: representa un modelo autorregresivo secuencial.

La forma del modelo MA es la siguiente:

Donde: el parámetro es una constante; el parámetro es el coeficiente del modelo de media móvil secuencial; es el orden de rezago de; el modelo de media móvil; es un valor medio de 0. Una secuencia de ruido blanco con varianza cero. Símbolo de modelo: representa un modelo de media móvil secuencial.

Los patrones ARIMA toman la forma:

Recuerda el modelo. es el orden de rezago del modelo autorregresivo, el orden de entero único de la serie temporal y el orden de rezago del modelo de orden de media móvil. En ese momento, el modelo degeneró en el modelo de caballo; en ese momento, el modelo ARIMA degeneró en el modelo AR.

3. Es necesario resolver tres problemas para establecer el modelo ARIMA. Del análisis anterior, se puede ver que establecer el modelo ARIMA necesita resolver los siguientes tres problemas:

(1) Convertir series no estacionarias en series estacionarias.

(2) Determinar la forma del modelo. Es decir, a cuál de AR, MA y ARMA pertenece el modelo. Esto se resuelve principalmente mediante el reconocimiento de patrones.

(3) Determinar el orden de rezago de la variable. Esa es la suma de números. Esto también se hace mediante la identificación del modelo.

4. Identificación de modelos ARIMA

Las herramientas para la identificación de modelos ARIMA son los coeficientes de autocorrelación y los coeficientes de autocorrelación parcial.

Coeficiente de autocorrelación: El coeficiente de autocorrelación de una serie temporal retrasada por k órdenes se estima mediante la siguiente fórmula:

donde es la media muestral de la secuencia y es el coeficiente de correlación de k valores del periodo. Se denomina coeficiente de autocorrelación de la serie temporal y el coeficiente de autocorrelación puede describir parcialmente la forma de un proceso estocástico. Muestra el grado de correlación entre datos adyacentes en la secuencia.

Coeficiente de autocorrelación parcial: El coeficiente de autocorrelación parcial es la correlación condicional entre ellos bajo unas condiciones dadas. El grado de correlación se mide mediante el coeficiente de autocorrelación parcial. La fórmula para estimar el coeficiente de autocorrelación parcial bajo un retraso de orden k es:

donde es el valor estimado del coeficiente de autocorrelación con un retraso de orden k. La razón por la que se llama correlación parcial es que mide la correlación de K períodos y no considera la correlación de k-1 períodos. Si esta forma de autocorrelación puede representarse mediante una autocorrelación con un desfase menor que k, entonces en k desfase de fase el valor de la correlación parcial tiende a 0.

Identificación:

El coeficiente de autocorrelación del modelo AR(p) muestra una caída exponencial o una caída oscilatoria a medida que K aumenta. La forma de caída específica depende del coeficiente del término de retraso de AR(. p) modelo. El coeficiente de autocorrelación parcial del modelo AR(p) se trunca en el orden P. Por lo tanto, el orden p del modelo AR(p) se puede determinar identificando el número de coeficientes de autocorrelación parcial del modelo AR(p).

El coeficiente de autocorrelación del modelo MA(q) se trunca después del paso Q. El coeficiente de autocorrelación parcial del modelo MA(q) debe presentar una forma de desintegración de cola.

El modelo ARMA(p, q) es un modelo combinado del modelo AR(p) y el modelo MA(q), por lo que el coeficiente de autocorrelación de ARMA(p, q) es la suma de AR(p) coeficiente de autocorrelación y mezcla de coeficientes de autocorrelación MA(q). Cuando p = 0, tiene la propiedad de truncamiento; cuando q = 0, tiene la propiedad de seguir la cola; cuando ni p ni q son 0, tiene la propiedad de seguir la cola.

Generalmente, el coeficiente de autocorrelación parcial del proceso ARMA(p, q) puede tener varios picos obvios antes del retraso de orden p, pero tiende gradualmente a cero a partir del término de retraso de orden p; autocorrelación El coeficiente tiene varias columnas marcadas obvias antes del retraso de orden q y gradualmente se acerca a cero a partir del término de retraso de orden q.

En tercer lugar, la selección de datos y variables

Este caso selecciona la serie temporal del PIB real de China para construir el modelo ARIMA, con el intervalo muestral de 1978 a 2001. Los datos provienen de los anuarios estadísticos de cada año en el sitio web de la Oficina Nacional de Estadísticas. Los datos del PIB se convierten a valores basados ​​en precios de 1978 a través del índice del PIB.

Ver Tabla 1:

Tabla 1: PIB de China de 1978 a 2003 (unidad: 100 millones de yuanes)

PIB anual

19783605.6198610132 8199446690.7

.

19794074198711784.7199558510.5

19804551.3198814704199668330.4

19814901.4198916466199774894.2

018319.5199879003.3

19836076.3199121280

19847164.4199225863.7200089340.9

19858792.1199334500.7200198592.9

Cuarto paso, pasos para establecer un modelo ARIMA

1. Prueba de raíz unitaria, confirmar el orden de los enteros.

Según el análisis de caso de la prueba de raíz unitaria, la serie temporal del PIB es unaria de segundo orden. Eso es d=2. ¿Convertir la serie del PIB en serie estacionaria mediante dos diferencias? . Utilice secuencias para construir modelos ARMA.

2. Identificación del modelo

Determine la forma del modelo y el orden de retraso, y utilice el coeficiente de autocorrelación (AC) y el coeficiente de autocorrelación parcial (PAC) para completar la identificación.

Primero introduzca los datos del PIB en el software Eviews y compruebe el AC y PAC de su diferencia de segundo orden. Abra la ventana de secuencia del PIB, haga clic en el botón Ver, aparecerá el menú, seleccione el gráfico de correlación, como se muestra en la siguiente figura:

Abra el cuadro de diálogo del gráfico de correlación, seleccione la diferencia de segundo orden y haga clic en Aceptar para obtener el AC y PAC de la secuencia. (También puede realizar una diferencia de segundo orden en la serie del PIB y luego seleccionar el nivel en el diagrama de correlación).

Como se puede ver en la figura, el coeficiente de autocorrelación (AC) de la serie es truncado en el primer orden, y la autocorrelación parcial. El coeficiente (PAC) está truncado en el segundo orden. Entonces el modelo de juicio es un modelo ARMA y. Es decir:

3. Modelado

Del análisis anterior, podemos saber que el modelo está establecido. Primero, diferencie la secuencia del PIB dos veces para obtener la secuencia. Luego cree un nuevo cuadro de diálogo de ecuación en el libro de trabajo Workfile y la ecuación se define utilizando el método de lista. El término de retraso autorregresivo está representado por ar y el término de media móvil está representado por ma. En este ejemplo, hay dos términos autorregresivos, por lo que están representados por ar(1) y ar(2), y un término de media móvil está representado por ma(1), como se muestra en la figura:

Haga clic en Aceptar para obtener los resultados estimados del modelo:

Desde la perspectiva de la bondad de ajuste, el modelo tiene un buen efecto de ajuste, con un estadístico DW de 2,43. El estadístico T de cada variable también superó la significación. prueba y el modelo es ideal. Los residuos de la prueba también son estables, por lo que se considera que el modelo está establecido correctamente.