Análisis de series temporales

Utilizamos modelos de aprendizaje automático para aprender cómo ajustar datos históricos para predecir el futuro. Este compartir se basa principalmente en la tradición.

El análisis de series temporales se realiza principalmente a partir de estos tres aspectos.

El análisis de series de tiempo es un campo de investigación distintivo que comenzó en la industria financiera, como la predicción de tendencias del mercado de valores, la evaluación de riesgos de inversión, etc. Posteriormente penetró en otros campos, y también tiene su hueco en las previsiones de mercado de futuro, la fijación de precios dinámicos, las previsiones de consumo eléctrico, la biomedicina, etc.

Las definiciones matemáticas son generalmente un lenguaje relativamente breve, riguroso y abstracto que describe un concepto. Un conjunto de variables aleatorias ordenadas en series de tiempo.

Representa una serie de tiempo de eventos aleatorios, abreviada como

En la predicción de series de tiempo, cada dato, es decir, el valor que vemos, es en realidad un valor de observación de una variable aleatoria. la variable aleatoria obedece a una determinada distribución. De hecho, los valores que vemos también pueden denominarse valores de observación. En realidad, son una realización de una secuencia aleatoria de tiempo, o un ejemplo. Todos los datos históricos que vemos son un conjunto de muestras de una serie de tiempo aleatoria.

De hecho, utilizamos el análisis para captar la esencia de esta serie temporal aleatoria.

Porque sabemos que cada punto obedece a la distribución global. Siempre que las propiedades de estas series de tiempo aleatorias se obtengan a través de datos, se puede captar la aparición de variables aleatorias. De hecho, es un proceso de estadística matemática, algo similar al modelo generativo del aprendizaje automático.

De hecho, el esquema general de la tarea de series de tiempo se ha descrito brevemente anteriormente.

Con el plan general en mente, seguimos estos pasos paso a paso, luego completamos los requisitos y completamos el pronóstico de la serie temporal.

El paso clave de la tarea es el análisis de series de tiempo, entonces, ¿qué es el análisis de series de tiempo? En resumen, el análisis de series de tiempo es el análisis estadístico de series de tiempo.

Entonces, ¿cuáles son los métodos de análisis específicos? Hay dos tipos principales, a saber, análisis descriptivo de series de tiempo y análisis estadístico de series de tiempo.

Existen dos definiciones de estacionariedad en la teoría del análisis de series temporales.

La llamada rigurosidad significa que todas las propiedades estadísticas de rigurosidad y estacionariedad no cambian con el tiempo. Ésta es la propiedad de la estacionariedad estricta y la definición de estacionariedad estricta.

En el futuro, puedes intentar describir algunos conceptos en lenguaje matemático.

También conocida como estacionariedad de covarianza, estacionariedad de segundo orden o estacionariedad generalizada, los momentos de primer y segundo orden de una serie temporal débilmente estacionaria no cambian con el tiempo.

Juzgar la estacionariedad de una serie temporal es útil para la selección posterior del modelo, por lo que la estacionariedad es una propiedad importante de una serie temporal y se puede utilizar para clasificar series temporales.

Hablaremos de la relación entre estacionariedad estricta y estacionariedad débil. Las secuencias que satisfacen la estacionariedad estricta tienen estacionariedad débil, pero la estacionariedad estricta no puede cubrir todas las estacionariedades débiles. ¿Por qué la estacionariedad estricta no puede cubrir toda la estacionariedad débil? Esto se debe a que la distribución de Cauchy es una serie de tiempo estrictamente estacionaria, pero no existe un momento de segundo o primer orden, por lo que la distribución de Cauchy es estrictamente estacionaria y no satisface la estacionariedad débil.

Cuando la serie temporal es una secuencia de distribución normal, todas las propiedades estadísticas de la distribución normal se describen mediante momentos de segundo orden, y la secuencia normal débilmente estacionaria también es estrictamente estacionaria.

Debido a que la mayoría de las series temporales son en realidad débilmente estacionarias, hoy también nos centraremos en las débilmente estacionarias.

Si el segundo momento de la serie temporal es finito

Vemos que el valor medio de la serie temporal es una constante a medida que cambia el tiempo.

La varianza, al igual que la media, es una constante, y la varianza es el segundo momento.

La covarianza también es un momento de segundo orden, independientemente de si los puntos en diferentes momentos son regulares, porque la covarianza débilmente estacionaria o la autocorrelación es función del intervalo de tiempo. Cuando las covarianzas de los intervalos de tiempo son iguales, las covarianzas correspondientes son diferentes cuando los intervalos son diferentes y también cambiarán cuando cambie S.

De hecho, buscamos una relación entre y . Aquí, usamos s para representar diferentes intervalos de tiempo, por ejemplo.

En otras palabras, la autocorrelación de una serie temporal débilmente estacionaria solo está relacionada con el retardo s y no tiene nada que ver con la posición inicial del tiempo t.

La autocorrelación se abrevia como una función unaria relacionada únicamente con el retardo de tiempo S, que es equivalente a la varianza.

El coeficiente de autocorrelación de una serie temporal estacionaria también se puede escribir simplemente como una función unaria relacionada con el retraso temporal s.

Si la serie temporal generada por un modelo es estacionaria, entonces el modelo es estacionario, en caso contrario es no estacionario.

Aquí tienes un pasaje que puedes entender. Los modelos AR, MA y ARMA son modelos de ajuste de secuencia estacionarios comúnmente utilizados, pero no todos los modelos AR, MA y ARMA son estacionarios.

Bien, volvamos a la ecuación en diferencias lineales. Centrémonos en dos expresiones para la ecuación en diferencias. Entre ellos, primero hablemos de qué es un operador retrasado.

Supongamos que la suma de las series temporales conocidas tiene la siguiente relación.

De hecho, no usamos y para representar sí, sino b para representar el retraso en el programa, y ​​así sucesivamente.

Así, el polinomio está representado por un operador de retraso.

Una ecuación en diferencias lineales de orden P típica es

Hoy hablaremos principalmente de algunas fórmulas de derivación de series de tiempo. Leí algo de información antes. La derivación detrás del modelo AR y el modelo MA comúnmente utilizados en series temporales es relativamente profunda y no es fácil de entender. Hace poco leí alguna información y el resumen es muy apropiado.

Aunque las series temporales son simples, se necesita algo de esfuerzo para comprenderlas realmente y dividirlas en las siguientes formas.

Estos artículos se expresan como series de tiempo usando un modelo aditivo. Podemos usar el modelo para ajustar los artículos de tendencia y los artículos de temporada, porque tienen reglas a seguir y necesitamos usar el modelo para aprender.

GPD es un modelo de tendencia que crece exponencialmente con el tiempo.

El flujo de gente en los supermercados es cíclico, con más gente los fines de semana que de lunes a viernes. Hay más gente cada tarde que por la mañana.

Eso significa que tenemos razón. Hemos comentado antes que una serie temporal es un proceso estocástico, es decir, distribuido conjuntamente. Generalmente, la distribución conjunta que estudiamos es un problema relativamente repetitivo.

Este es uno de los primeros análisis de NPL, que utiliza la regla de la cadena para expresar probabilidades conjuntas cuando estamos en modelos estadísticos.

Casi todos los que la han estudiado conocen la probabilidad condicional. La variable aleatoria en cada momento de la serie temporal está relacionada con la probabilidad de su punto temporal aleatorio anterior. Esta es la probabilidad conjunta, y calcular esta probabilidad conjunta requiere un esfuerzo computacional considerable.

Cuando a es menor que 1, significa que el modelo es estable; de ​​lo contrario, significa que el modelo es inestable. ¿Por qué hay tal conclusión? Podemos resolver este problema combinando el principio del aterrizaje de la pelota.

De hecho, nuestra ecuación en diferencias no homogénea

La siguiente es una solución general de la ecuación en diferencias.

Entre ellos, b es también el operador de retraso L, representado aquí por b. Demostrado nuevamente aquí.

A continuación, calcula la solución característica y extrae el lado izquierdo.

Puede representar la forma de suma de infinitas variables. Todo el mundo debería estar familiarizado con ella y es similar, por lo que utilizamos la suma de series geométricas.

Investigación de correlación crítica y computabilidad. La correlación de la secuencia AR es una caída exponencial negativa y el modelo MA (q) es una correlación limitada.

Correlación de series de tiempo finitas

Predicción basada en el principio del mínimo error cuadrático medio.

Ese es el modelo AR que estamos discutiendo, luego el modelo AR se puede utilizar para el análisis de series de tiempo.

De esta forma, la distribución de la serie temporal se ajusta a la distancia de sincronización, por lo que la serie temporal es una serie temporal estable. Filtro Lineal

Este es otro modelo para estudiar series de tiempo, estudiado a través del dominio de la frecuencia.