Traducción automática basada en red neuronal artificial

Desde 2013, con el tremendo progreso en la investigación del aprendizaje profundo, ha ido surgiendo gradualmente la traducción automática neuronal basada en redes neuronales artificiales. El núcleo de su tecnología es una red neuronal profunda con una gran cantidad de nodos (neuronas), que pueden aprender automáticamente conocimientos de traducción del corpus. Después de la vectorización, las oraciones en un idioma se transmiten capa por capa en la red, se convierten en expresiones que la computadora puede "entender" y luego se traducen a otro idioma a través de múltiples capas de operaciones de transmisión complejas. Se realiza el modelo de traducción de "comprender el lenguaje y generar traducción". La mayor ventaja de este método de traducción es que la traducción es fluida, más gramatical y fácil de entender. En comparación con la tecnología de traducción anterior, la calidad ha mejorado a pasos agigantados.

Actualmente, las Redes Neuronales Recurrentes (RNN) son muy utilizadas en la traducción automática. Este modelo es bueno para modelar el lenguaje natural, convirtiendo oraciones de longitud arbitraria en vectores de punto flotante de dimensiones específicas, mientras "recuerda" las palabras más importantes de la oración para que la "memoria" pueda conservarse durante mucho tiempo. Este modelo resuelve el problema de vectorización de oraciones en lenguaje natural y es de gran importancia para el uso de computadoras para procesar lenguajes naturales. Permite a las computadoras procesar el lenguaje ya no en el nivel de coincidencia de texto simple, sino en el nivel de comprensión semántica.

Instituciones y empresas de investigación representativas, incluido el Laboratorio de Aprendizaje Automático de la Universidad de Montreal en Canadá, han lanzado Marmot, un sistema de traducción automática de código abierto basado en redes neuronales. En 2015, Baidu lanzó un sistema de traducción en línea que integra estadísticas y métodos de aprendizaje profundo, y Google también ha realizado una investigación en profundidad en esta área.