Tesis de graduación sobre la aplicación de la minería de datos en la tecnología de ingeniería de software

Tesis de graduación sobre la aplicación de la minería de datos en la tecnología de ingeniería de software

Resumen A medida que se desarrolla la tecnología informática, el software se vuelve cada vez más complejo y el trabajo de desarrollo de sistemas se vuelve más importante. La aplicación extensiva de la tecnología de la información generará una gran cantidad de datos. La extracción de datos y el análisis de sus patrones existentes son de gran importancia para la utilización eficaz de los recursos de datos. Este artículo explica brevemente la aplicación de la tecnología de minería de datos en la ingeniería de software.

Palabras clave tecnología de minería de datos; ingeniería de software; tecnología de software de aplicación

Con el desarrollo de la tecnología de la información, se desarrolla rápidamente, pero su controlabilidad no es extremadamente fuerte. . El software generará una gran cantidad de datos durante el proceso de solicitud. Los datos son un recurso valioso y su uso eficaz puede aportar valor añadido. Como industria de desarrollo de software, la aplicación de la tecnología de minería de datos logra la utilización efectiva de los recursos de datos al estudiar las reglas, proporciona la orientación correspondiente para la ingeniería de software y puede manejar eficazmente las fallas del sistema y mejorar la efectividad de la evaluación de costos.

1 Problemas en la aplicación de la tecnología de minería de datos

1.1 La complejidad de los datos de información en sí

Los datos contenidos en la ingeniería de software se pueden dividir en dos categorías: Estructurado versus no estructurado. El código de software juega un papel importante en los datos no estructurados. Lo que afecta a los datos estructurados es la información de la versión del software. Existe una estrecha conexión entre los datos estructurados y no estructurados. Para lograr una utilización eficaz de los datos, es necesario conocer las reglas a través de determinadas tecnologías. La tecnología de minería de datos simplemente satisface las necesidades. Utilice esta tecnología para integrar datos estructurados y no estructurados para mejorar la efectividad de su uso.

1.2 Falta de coherencia en los estándares de evaluación

La tecnología de minería de datos se utiliza ampliamente en la vida. Mediante la aplicación de esta tecnología, podemos evaluar mejor la situación real y así evaluar los resultados. Optimizar. Sin embargo, la falta de estándares unificados hace que la información del software sea compleja. Y hay diferencias en la forma de expresión. Los adquirentes de información no pueden aplicar ni comparar la información de manera efectiva. La razón de la falta de estándares unificados para la información radica en los métodos de evaluación inconsistentes.

2 Aplicación de la tecnología de minería de datos en la ingeniería de software

2.1 Registro de ejecución de minería de datos

La minería de registros de ejecución consiste principalmente en analizar la ruta del programa principal, por lo que en cuanto a descubrir las correlaciones que existen en el código del programa. La esencia es analizar las rutas de ejecución relevantes y realizar modelos inversos para finalmente lograr el objetivo. La función es verificar, mantener y comprender el programa. El proceso de minería de registros generalmente implica la instrumentación preliminar del sistema que se está analizando, seguido del proceso de registro, que registra las variables de estado de la interfaz de programación de la aplicación, el sistema y los módulos después de ejecutar el paso anterior, y finalmente registra la información obtenida. reducción, filtrado y agrupamiento. El modelo resultante es capaz de expresar las características del sistema.

 2.2 Detección de vulnerabilidades

Habrá lagunas en el sistema o en el software en sí, y las lagunas en sí mismas tienen un cierto grado de ocultación. Debido a que el pensamiento humano tiene ciertos puntos ciegos, la existencia de. No se pueden descubrir lagunas, por lo que se requiere algún software. El propósito de la detección de vulnerabilidades es descubrir las lagunas y errores en el software y repararlos para garantizar la calidad y seguridad del software. Para aplicar la tecnología de minería de datos a las pruebas de software, primero debemos determinar los elementos de la prueba, planificar el contenido de la prueba en función de las necesidades del usuario, determinar el método de prueba y formular planes específicos. El proceso de prueba consiste principalmente en limpiar y convertir datos, que se basa en la recopilación de datos de vulnerabilidad. Al limpiar la información recopilada, los datos que están relacionados con los datos del software y que tienen defectos se filtrarán y los datos restantes sin datos. Se limpiará. Tomará las medidas correspondientes para complementar los elementos faltantes y convertir sus atributos en representaciones numéricas. El siguiente paso es seleccionar el modelo apropiado para capacitación y verificación. Este vínculo debe combinarse con las necesidades reales del proyecto para seleccionar el método de minería y encontrar el método más adecuado analizando y comparando diferentes resultados de datos. Posteriormente, los métodos anteriores se aplican repetidamente para localizar y detectar vulnerabilidades en el software.

Y recopile los datos correspondientes en la biblioteca de software, clasifíquelos según la descripción de la vulnerabilidad y finalmente aplique el conocimiento obtenido a través de la minería al proyecto probado

 2.3 Software de código abierto

Debido a su propia apertura, dinámica y naturaleza global, la gestión del software de código abierto debe tratarse de manera diferente al software de gestión tradicional. En general, el software de código abierto maduro tiene registros relativamente completos de aplicaciones de software y el contenido de la participación incluye errores. informes, actividades del desarrollador. El personal involucrado en el desarrollo estará en medio de cambios dinámicos. La razón de la existencia de cambios dinámicos radica en la apertura del software. Al mismo tiempo, la extracción de características dinámicas en el software puede lograr el objetivo de una gestión de alta calidad del software de código abierto.

2.4 Información de control de versiones

Para garantizar la unidad del contenido de edición del personal del proyecto, es necesario controlar la aplicación del sistema. En las aplicaciones de ingeniería de desarrollo de software, la gestión y protección del trabajo de desarrollo se implementará a través de sistemas de control de versiones. Y su método de aplicación es principalmente extraer datos de cambios, descubrir la relación entre diferentes módulos y sistemas y detectar posibles vulnerabilidades en el programa. La aplicación de este tipo de tecnología puede reducir efectivamente el costo de mantenimiento posterior del sistema y también evitar hasta cierto punto las lagunas causadas por cambios posteriores.

3 Aplicación de la minería de datos en la ingeniería de software

3.1 Método de correlación

Este método se utiliza para encontrar conexiones relevantes y asociaciones interesantes en los datos. Las reglas de asociación incorporadas tienen dos características obvias. ①Soporte; ②Confiabilidad. Lo primero significa que en un determinado conjunto de cosas, la probabilidad de que ocurran dos subconjuntos es la misma. Este último muestra la probabilidad de que algo en un conjunto de cosas también aparezca en otra cosa.

3.2 Método de clasificación

Este método se aplica principalmente a la operación de etiquetas de clasificación y valores discretos. Los pasos de este método son primero establecer un modelo correspondiente, describir los datos y utilizar el modelo para clasificarlos. En términos de selección del método de clasificación, los métodos comúnmente utilizados incluyen el método del árbol de decisión, el método bayesiano, el método de la máquina de términos de soporte, etc. La base para la aplicación del método del árbol de decisión es el algoritmo codicioso.

3.3 Método de agrupación

Los métodos más utilizados incluyen el método de partición, densidad, modelo, método basado en cuadrícula y método jerárquico. La entrada del análisis de conglomerados es un conjunto de pares ordenados, y los datos de los pares ordenados representan respectivamente la muestra y la similitud. Su teoría de aplicación básica es aplicarlo en función de diferentes datos de objetos.

4 Aplicación de la minería de datos en la ingeniería de software

4.1 Minería de datos de código clonado

Lo más primitivo en ingeniería de software es la inspección de pruebas de código clonado. En cuanto a su enfoque, se basa en la comparación de textos y la comparación de identificadores. El primero utiliza las declaraciones contenidas en el código del programa del sistema para emitir juicios. En el proceso de mejora posterior de este método, el objetivo principal es mejorar la eficiencia de la coincidencia de cadenas. En el proceso de solicitud real, la eficiencia se optimiza mediante la coincidencia de funciones de correlación.

4.2 Recuperación y minería de datos de software

Este método es también uno de los requisitos de minería originales en la ingeniería de software. Este método tiene principalmente los siguientes tres pasos en su aplicación.

①Ingreso de datos. Su esencia es ingresar la información que necesita ser recuperada y combinarla con la necesidad del usuario de encontrar los datos que el usuario necesita en los datos.

②Proceso de búsqueda de información. Después de confirmar la información que el usuario necesita encontrar, el sistema buscará en la base de datos según el contenido de la información y la clasificará.

③ Exportar y ver datos de información. Los usuarios pueden exportar datos o verlos en línea según sus propias necesidades. Cuando se exporten los datos, se formarán los registros correspondientes, lo que hará que sea más conveniente y rápido para los clientes realizar búsquedas nuevamente. La exportación de datos requiere el uso de software relevante.

4.3 Tres etapas aplicadas al diseño

La ingeniería de software tiene mucha información sobre el software, y la información generalmente se almacena en el código base. El uso de datos puede mejorar la eficiencia del trabajo. Cada ciclo de ingeniería de software genera una gran cantidad de datos. Según el ciclo de vida de la ingeniería de software, se puede dividir en tres etapas: análisis y diseño, desarrollo iterativo y mantenimiento y aplicación.

4.4 Minería de conjuntos de datos de gestión de proyectos

Hasta ahora, el trabajo de desarrollo de software ha integrado múltiples disciplinas en una. Como por ejemplo economía, comportamiento organizacional, gestión, etc.

Para los desarrolladores de software, la atención se centra no sólo en la innovación tecnológica, sino también en la gestión científica y estandarizada. Además de la extracción de información de control de versiones, también existe la extracción de relaciones con la organización del personal. Para el trabajo de desarrollo de software a gran escala, la asignación y coordinación efectiva de los recursos humanos también es un problema que debe enfrentarse en el campo del trabajo de software. Por ejemplo, en el proceso de desarrollo de sistemas a gran escala, a menudo participan muchas personas y es necesario establecer comunicación entre ellas. Los métodos de comunicación incluyen comunicación cara a cara, transferencia de documentos, información electrónica, etc. Explorar las relaciones entre el personal favorece el desarrollo del trabajo de gestión. La red en la que existen grupos de empleados es una red social. A través de una organización y asignación razonable de personal, afectará el cronograma, el costo y la posibilidad de éxito del proyecto. La investigación de implementación en esta área generalmente utiliza modelos de simulación.

5 Conclusión

La tecnología de ingeniería de software se utiliza ampliamente en muchos campos de la vida. Como una de las tecnologías, la minería de datos tiene su importancia y su papel a medida que la tecnología se desarrolla. más obvio. Para garantizar la confiabilidad y eficiencia de la tecnología de excavación, tiene cierta integración con otras tecnologías de ingeniería. La minería de datos ha mostrado enormes beneficios económicos en aplicaciones prácticas, por lo que se debe promover vigorosamente el alcance de su aplicación y ampliar la profundidad y el nivel de su aplicación.

Referencias

[1]Li Honglan. Una revisión de la aplicación de la tecnología de minería de datos en la ingeniería de software[J]. >

[2] Lei Lei. Una revisión de la aplicación de la tecnología de minería de datos en la ingeniería de software [J]. en ingeniería de software Una revisión de aplicaciones en ingeniería de software [J China New Communications, 2015 (15).