Una revisión de la traducción automática estadística

Actualmente, la mayoría de los pares de idiomas de Google Translate utilizan traducción automática estadística. En los últimos años, Google también ha mantenido una posición de liderazgo en este campo y está muy por delante en la evaluación de traducción automática organizada por la Oficina Nacional de Estándares.

La tarea principal de la traducción automática estadística es construir un modelo estadístico razonable para la salida del lenguaje y, sobre la base de este modelo estadístico, definir los parámetros del modelo que se estimarán y diseñar un algoritmo de estimación de parámetros. Las primeras traducciones automáticas estadísticas basadas en palabras utilizaban modelos de canales ruidosos y criterios de máxima verosimilitud para el entrenamiento no supervisado. En los últimos años, la traducción automática estadística basada en frases de uso común ha adoptado un método de capacitación diferenciado, que generalmente requiere capacitación supervisada con referencia al corpus.