La traducción automática es el proceso de utilizar computadoras para convertir un idioma natural (idioma de origen) en otro idioma natural (idioma de destino).
El proceso de traducción automática se puede dividir en tres etapas: análisis del texto original, conversión de la traducción y generación de la traducción.
En la actualidad, existen dos métodos principales de traducción automática: métodos de reglas y métodos estadísticos.
El método basado en reglas analiza el texto según las reglas del idioma y luego lo traduce con la ayuda de programas informáticos.
Los métodos estadísticos construyen un modelo de traducción estadística (vocabulario, comparación o modelo de lenguaje) a través del análisis estadístico de una gran cantidad de corpus paralelos y luego utilizan este modelo para la traducción. Generalmente, se selecciona como traducción el término con mayor probabilidad de aparición en estadística y el algoritmo de probabilidad se basa en el teorema de Bayes.
La traducción automática se puede dividir en muchos tipos.
La traducción automática basada en reglas significa que el sistema de traducción automática se basa en reglas del lenguaje, incluido el método directo, el método de conversión y el método de lenguaje intermedio.
La traducción automática basada en estadísticas se refiere al problema de la traducción automática como un canal ruidoso. El principio de la traducción automática basada en casos es almacenar algunos ejemplos del texto original y la traducción correspondiente en la máquina, de modo que el sistema pueda consultar estos ejemplos para la traducción analógica.
Traducción automática multimotor: los tres métodos de traducción automática anteriores tienen sus propias ventajas y desventajas. Por lo tanto, la integración de varios métodos de alguna manera forma un sistema de traducción automática multimotor. El sistema integra traducción automática basada en reglas, traducción automática basada en instancias y motores de conversión de vocabulario.