Artículos de investigación de aplicaciones sobre algoritmos y tecnologías de minería de datos

Trabajo de investigación de aplicaciones sobre tecnologías y algoritmos de minería de datos

Resumen: La minería de datos es el descubrimiento de información y conocimiento ocultos, regulares y desconocidos a partir de una gran cantidad de datos de aplicaciones prácticas incompletas, ruidosas, confusas y aleatorias. proceso, pero que es potencialmente útil y, en última instancia, comprensible. Las técnicas de minería de datos se pueden utilizar siempre que se requiera gestión de datos y descubrimiento de conocimientos para resolver el problema. Este artículo estudia la aplicación de algoritmos de minería de datos y tecnología de minería de datos, y estudia la aplicación de la tecnología de minería de datos.

Palabras clave: minería de datos; tecnología; aplicación;

Introducción: La tecnología de minería de datos es el resultado de la investigación y el desarrollo a largo plazo de la tecnología de bases de datos. Inicialmente, varios datos comerciales se almacenaban en bases de datos informáticas y luego se desarrollaban para consultar y acceder a bases de datos, y luego para recorrer las bases de datos en tiempo real. La minería de datos lleva la tecnología de bases de datos a una etapa más avanzada. No solo puede consultar y recorrer datos pasados, sino también encontrar relaciones potenciales entre datos pasados, facilitando así la transferencia de información.

1. Descripción general de la minería de datos

La minería de datos consiste en descubrir información e información oculta, regular y desconocida a partir de una gran cantidad de datos de aplicaciones prácticas incompletas, ruidosas, confusas y aleatorias. proceso extraordinario de conocimiento, pero potencialmente útil y, en última instancia, comprensible.

2. Proceso básico de minería de datos

(1) Selección de datos: seleccione datos relacionados con el objetivo de minería de datos. El procesamiento de datos basado en diferentes objetivos de minería de datos no solo puede eliminar interferencias innecesarias de datos, sino que también mejora en gran medida la eficiencia de la minería de datos. (2) Preprocesamiento de datos: incluye principalmente limpieza de datos, integración y conversión de datos, reducción de datos, discretización y generación de nivel de concepto. (3) Descubrimiento de patrones: el proceso de descubrir patrones de interés para los usuarios a partir de datos es el proceso principal de descubrimiento de conocimiento. (4) Evaluación de patrones: Obtener un patrón que realmente represente el conocimiento a través de ciertas medidas. En términos generales, la minería de datos empresariales sigue principalmente los siguientes procesos: Preparación de datos, es decir, recopilación y acumulación de datos. En este momento, las empresas necesitan saber qué tipo de datos necesitan y obtener datos objetivos claros y objetivos mediante la clasificación, edición, limpieza y preprocesamiento. La minería de datos es el paso más crítico. El objetivo principal es extraer más datos preprocesados ​​para obtener datos más objetivos y precisos antes de tomar decisiones. Diferentes empresas pueden utilizar diferentes tecnologías de extracción de datos, pero en la actualidad es imposible deshacerse de los métodos de extracción anteriores. Por supuesto, con el avance de la tecnología, los big data definitivamente se convertirán en la base de las empresas y se han aplicado en muchos campos. Por ejemplo, el marketing es el primer campo de aplicación de la minería de datos. Su objetivo es extraer los hábitos de consumo de los usuarios, analizar las características de consumo de los usuarios y luego realizar un marketing preciso. Tomemos como ejemplo los odiosos anuncios emergentes. Cuando los consumidores tienen el hábito de comprar en línea, buscan sus productos favoritos en línea y, cuando vuelven a buscar, aparecerán muchos productos dirigidos a los hábitos de consumo de los consumidores.

En tercer lugar, métodos de minería de datos

1.

Agrupar consiste en dividir toda la base de datos en diferentes grupos. El propósito es hacer obvias las diferencias entre grupos y que los datos del mismo grupo sean lo más similares posible. Una aplicación típica de la agrupación en el comercio electrónico es ayudar a los analistas de mercado a encontrar diferentes grupos de clientes de la base de clientes y utilizar patrones de compra para describir las características de los diferentes grupos de clientes. Además, el análisis de conglomerados se puede utilizar como paso de preprocesamiento para otros algoritmos, como la caracterización y la clasificación, que luego se procesan en los conglomerados resultantes. A diferencia de la clasificación, no sabes cómo dividir los datos en grupos o cómo dividirlos (según qué variables) antes de comenzar a agruparlos. Por lo tanto, después de la agrupación, alguien familiarizado con el negocio debe explicar el significado de esta agrupación. En muchos casos, es posible que el clúster que obtenga a la vez no sea beneficioso para su negocio. En este momento, es necesario eliminar o agregar variables para afectar el método de agrupación. Después de varias iteraciones, finalmente puedes obtener un resultado ideal. Hay dos tipos principales de métodos de agrupación, incluidos los métodos estadísticos y los métodos de redes neuronales. El método de red neuronal autoorganizada y las K-medias son algoritmos de agrupación de uso común.

2. Árbol de decisión.

Esto es muy poderoso para resolver problemas de clasificación y predicción.

A través de una serie de preguntas se forman y expresan reglas, y luego mediante cuestionamientos continuos se obtienen los resultados requeridos. Un árbol de decisión típico tiene una raíz en la parte superior y muchas hojas en la parte inferior. Los registros se dividen en diferentes subconjuntos, cada uno de los cuales puede contener una regla simple.

4. Campos de aplicación de la minería de datos

4.1 Marketing

La aplicación de la minería de datos de marketing en la industria de ventas se puede dividir en dos categorías: ventas de bases de datos y Análisis de datos de la cesta de la compra. La tarea del primero es seleccionar clientes potenciales a través de consultas interactivas, segmentación de datos y predicción de modelos para venderles productos, en lugar de seleccionar ciegamente clientes para vender productos como antes, la tarea del segundo es analizar los datos de ventas del mercado para identificar patrones de clientes; del comportamiento de compra, ayudando así a determinar el diseño de los estantes de la tienda y el lanzamiento para promocionar una determinada mercancía.

4.2 Inversión financiera

Los campos típicos del análisis financiero incluyen la evaluación de inversiones y la predicción del mercado de valores. El método de análisis generalmente utiliza el método de predicción de modelos. También están la selección de acciones de Fidelity y LBS Capital Management. La tarea del primero es utilizar modelos de redes neuronales para seleccionar inversiones, mientras que el segundo utiliza sistemas expertos, redes neuronales y tecnología de algoritmos genéticos para ayudar en la gestión de valores por valor de hasta 600 millones de dólares.

Conclusión: La minería de datos es una nueva tecnología inteligente de procesamiento de información. Con el rápido desarrollo de la tecnología de la información relacionada, los campos de aplicación de la minería de datos continúan ampliándose y profundizándose, especialmente en los campos de las telecomunicaciones, el ejército, la bioingeniería y la inteligencia empresarial, que se convertirán en nuevos focos de investigación. Al mismo tiempo, la aplicación de la minería de datos también enfrenta muchos desafíos técnicos. Cómo extraer tipos complejos de datos, la integración de la minería de datos con bases de datos, almacenes de datos y tecnologías web, la visualización y la calidad de los datos de la minería de datos requieren más investigación y exploración.

Referencia

[1] Li Haichen y Meng Qiang. Investigación sobre tecnología de minería de datos web y su aplicación [J]. Tecnología informática y de la información, 2017, 25 (1): 59-62.

[2]Gao Haifeng. Investigación sobre la aplicación de tecnología de minería de datos en sistemas de transporte inteligentes [J]. Tecnología y aplicaciones digitales, 2016(5): 108-108.

yle/tongji.js">