¿Cuáles son las principales tareas de la minería de datos?

Hay seis tareas principales de la minería de datos: análisis de asociación, análisis de conglomerados, clasificación, predicción, patrón de series temporales, análisis de desviación

1. propuesto por primera vez por otros. La regularidad entre los valores de dos o más variables se llama asociación. La asociación de datos es un tipo importante de conocimiento detectable que existe en la base de datos. La asociación se divide en asociación simple, asociación temporal y asociación causal. El propósito del análisis de correlación es encontrar la red de correlación oculta en la base de datos.

2. Análisis de conglomerados: la agrupación consiste en clasificar datos en varias categorías en función de la similitud. Los datos de la misma categoría son similares entre sí y los datos de diferentes categorías son diferentes. El análisis de conglomerados puede establecer conceptos macro, descubrir patrones de distribución de datos y posibles relaciones entre atributos de datos.

3. La clasificación consiste en encontrar la descripción conceptual de una categoría, que representa la información general de este tipo de datos, es decir, la descripción connotada de la categoría, y utiliza esta descripción para construir un modelo. normalmente utilizando reglas o árboles de decisión. La clasificación consiste en utilizar el conjunto de datos de entrenamiento para obtener las reglas de clasificación a través de un determinado algoritmo. La clasificación se puede utilizar para la descripción y predicción de reglas.

4. La previsión consiste en utilizar datos históricos para descubrir las reglas de cambio, establecer un modelo y utilizar el modelo para predecir los tipos y características de datos futuros. Los pronósticos se ocupan de la precisión y la incertidumbre, generalmente medidas por la varianza del pronóstico.

5. Los patrones de series temporales se refieren a patrones con una alta probabilidad de recurrencia que se buscan a través de series temporales. Al igual que la regresión, también utiliza datos conocidos para predecir valores futuros, pero la diferencia entre estos datos es el momento en el que se ubican las variables.

6. El análisis de desviación incluye muchos conocimientos útiles en la desviación. Hay muchas anomalías en los datos de la base de datos. El método básico de prueba de sesgo es encontrar la diferencia entre los resultados observados y la referencia.

avascript" src="/style/tongji.js">