Estado actual y tendencias del aprendizaje profundo

Foro

Actividades

Nuevos miembros

Temas

Abra la aplicación CSDN.

¿Derechos de autor? CSDN.NET, 1999-2020, todos los derechos reservados

Buscar publicaciones/publicaciones/usuarios de blog

Iniciar sesión

Un veterano al que le gusta jugar a la salsa de soja.

Preste mucha atención

Análisis de la tendencia de desarrollo de la tecnología de aprendizaje profundo

2019-04-09 08:37:11

1 Me gusta

Un veterano al que le gusta hacer salsa de soja.

Código edad 2 años

Presta mucha atención

/s/fthikinev 483 HIE 053 rpkg

Actualmente, el desarrollo de artificiales La inteligencia ha prestado plena atención y promoción de los avances en la tecnología de aprendizaje profundo. Los gobiernos de todo el mundo le conceden gran importancia y el auge del capital sigue aumentando. Todos los ámbitos de la vida también han llegado a un consenso de que se ha convertido en un lugar de gran desarrollo. Este artículo tiene como objetivo analizar la situación actual de la tecnología de aprendizaje profundo, juzgar la tendencia de desarrollo del aprendizaje profundo y presentar sugerencias de desarrollo basadas en el nivel técnico de mi país.

1. Estado actual de la tecnología de aprendizaje profundo

El aprendizaje profundo es la tecnología clave para esta ronda de explosión de la inteligencia artificial. Los avances en la tecnología de inteligencia artificial en la visión por computadora y el procesamiento del lenguaje natural han marcado el comienzo de una nueva ronda de desarrollo explosivo de la inteligencia artificial. El aprendizaje profundo es la tecnología clave para lograr estos avances. Entre ellos, la tecnología de clasificación de imágenes basada en redes convolucionales profundas ha superado la precisión del ojo humano, la tecnología de reconocimiento de voz basada en redes neuronales profundas ha alcanzado una precisión del 95% y la tecnología de traducción automática basada en redes neuronales profundas se ha acercado al humano promedio. nivel de traducción. La mejora sustancial en la precisión ha llevado la visión por computadora y el procesamiento del lenguaje natural a la etapa de industrialización, provocando el surgimiento de industrias emergentes.

El aprendizaje profundo es un arma algorítmica en la era del big data y se ha convertido en un foco de investigación en los últimos años. En comparación con los algoritmos tradicionales de aprendizaje automático, la tecnología de aprendizaje profundo tiene dos ventajas. En primer lugar, la tecnología de aprendizaje profundo puede mejorar continuamente el rendimiento a medida que aumenta el tamaño de los datos, mientras que los algoritmos tradicionales de aprendizaje automático tienen dificultades para utilizar datos masivos para mejorar continuamente el rendimiento. En segundo lugar, la tecnología de aprendizaje profundo puede extraer características directamente de los datos, lo que reduce el trabajo de diseñar extractores de características para cada problema, mientras que los algoritmos tradicionales de aprendizaje automático requieren la extracción manual de características. Por lo tanto, el aprendizaje profundo se ha convertido en una tecnología popular en la era del big data, y tanto el mundo académico como la industria han realizado una gran cantidad de investigaciones y trabajos prácticos sobre el aprendizaje profundo.

Varios modelos de aprendizaje profundo potencian plenamente las aplicaciones básicas. La red neuronal convolucional y la red neuronal recurrente son dos modelos de redes neuronales profundas ampliamente utilizados. La visión por computadora y el procesamiento del lenguaje natural son dos aplicaciones fundamentales de la inteligencia artificial. Las redes neuronales convolucionales se utilizan ampliamente en el campo de la visión por computadora y su rendimiento en tareas como clasificación de imágenes, detección de objetivos y segmentación semántica supera con creces los métodos tradicionales. Las redes neuronales recurrentes son adecuadas para resolver problemas relacionados con información de secuencia y han sido ampliamente utilizadas en el campo del procesamiento del lenguaje natural, como el reconocimiento de voz, la traducción automática, los sistemas de diálogo, etc.

2. La tendencia de desarrollo del aprendizaje profundo

Las redes neuronales profundas muestran una tendencia de desarrollo cada vez más profunda y con estructuras cada vez más complejas. Para mejorar continuamente el rendimiento de las redes neuronales profundas, la industria continúa explorando desde dos aspectos: la profundidad de la red y la estructura de la red. El número de capas de redes neuronales se ha expandido a cientos o incluso miles de capas. A medida que aumenta el número de capas de red, su efecto de aprendizaje se vuelve cada vez mejor. En 2015, ResNet propuesto por Microsoft superó por primera vez la precisión de las tareas de clasificación de imágenes con una profundidad de red de 152 capas. Constantemente se proponen nuevas estructuras de diseño de redes, lo que hace que la estructura de las redes neuronales sea cada vez más compleja. Por ejemplo, en 2014, Google propuso la estructura de red inicial, en 2015, Microsoft propuso la estructura de red residual y en 2016, Huang Gao y otros propusieron la estructura de red densamente conectada. Estos diseños de estructuras de red mejoran continuamente el rendimiento de las redes neuronales profundas.

Las funciones de los nodos de las redes neuronales profundas se enriquecen constantemente. Para superar las limitaciones de las redes neuronales actuales, la industria ha explorado y propuesto un nuevo tipo de nodo de red neuronal, haciendo que las funciones de las redes neuronales sean cada vez más abundantes. 2017, Jeffrey? Hinton propuso el concepto de red de cápsulas, utilizando cápsulas como nodos de red, que en teoría está más cerca del comportamiento del cerebro humano para superar las limitaciones de las redes neuronales convolucionales, como la falta de capas espaciales y capacidades de razonamiento.

En 2018, académicos de DeepMind, Google Brain y el MIT propusieron conjuntamente el concepto de redes de gráficos y definieron una nueva clase de módulos con funciones de sesgo de inducción relacional, con el objetivo de potenciar el aprendizaje profundo con razonamiento causal.

La tecnología de aplicaciones de ingeniería de redes neuronales profundas se está profundizando. La mayoría de los modelos de redes neuronales profundas tienen cientos de millones de parámetros y ocupan cientos de megabytes de espacio. Son difíciles de implementar en dispositivos terminales con rendimiento y recursos limitados, como teléfonos inteligentes, cámaras y dispositivos portátiles. Para resolver este problema, la industria utiliza tecnología de compresión de modelos para reducir los parámetros y el tamaño del modelo y reducir la cantidad de cálculo. Los métodos de compresión de modelos utilizados actualmente incluyen la poda del modelo entrenado (como poda, reparto de peso y cuantificación, etc.) y el diseño de modelos más sofisticados (como MobileNet, etc.). El proceso de modelado de algoritmos de aprendizaje profundo y ajuste de parámetros es complejo. el umbral de aplicación es alto. Para reducir el umbral de aplicación del aprendizaje profundo, la industria ha propuesto la tecnología de aprendizaje automático (AutoML), que puede realizar el diseño automatizado de redes neuronales profundas y simplificar el proceso de uso.