Para reimpresiones comerciales, comuníquese con el autor para obtener autorización. Para reimpresiones no comerciales, indique la fuente.
Autor: Wang Bibi
Enlace:/question/24588198/answer/38342825
Fuente: Zhihu.
En la actualidad, los dos métodos de traducción automática más importantes son: el método de reglas y el método estadístico.
1. La traducción automática basada en reglas (RBMT) analiza el texto de acuerdo con las reglas del idioma y luego lo traduce con la ayuda de programas informáticos. La mayoría de los sistemas comerciales de traducción automática adoptan un enfoque de reglas.
El funcionamiento del sistema de traducción automática basado en reglas se logra a través de tres etapas consecutivas de análisis, conversión y generación, que se dividen en tres niveles según la complejidad de las tres etapas.
Traducción directa: una traducción sencilla palabra por palabra.
Traducción: Durante el proceso de traducción se debe consultar y considerar la información léxica, sintáctica y semántica del texto original. Debido a que la gama de fuentes de información es demasiado amplia, hay demasiadas reglas gramaticales y hay contradicciones y conflictos entre ellas, la traducción de conversión es más complicada y propensa a errores. Sin mencionar la conversión, solo basándose en varias reglas gramaticales, el análisis del idioma de origen colapsará, ¡está bien!
-Traducción internacional: De momento, es sólo una idea. Probablemente quiera decodificar información lingüística en una forma universal independiente del lenguaje. El lenguaje internacional en sí mismo es un lenguaje artificial, ¿cómo puede ser independiente de la forma del lenguaje? La idea apareció por primera vez en orz en el siglo XIII.
Los derechos de autor pertenecen al autor.
Para reimpresiones comerciales, comuníquese con el autor para obtener autorización. Para reimpresiones no comerciales, indique la fuente.
Autor: Wang Bibi
Enlace:/question/24588198/answer/38342825
Fuente: Zhihu.
Pirámide de Bernard Voquet
2. La traducción automática estadística (SMT), a través del análisis estadístico de un gran número de corpus paralelos, construye un modelo de traducción estadística (léxico, comparativo o lingüístico) y luego use este modelo para la traducción. Generalmente, se selecciona como traducción la entrada con la probabilidad estadística más alta y el algoritmo de probabilidad se basa en el teorema de Bayes. Supongamos que una oración en inglés A se va a traducir al chino, y que todas las oraciones chinas B son traducciones potenciales de A. Pr(A) es la probabilidad de que aparezcan expresiones similares a A. Pr(B|A) es la probabilidad de que A sea. traducido a B. Buscar El valor máximo de los dos parámetros puede limitar el alcance de recuperación de oraciones y sus traducciones correspondientes, encontrando así la traducción más adecuada.
Según los diferentes niveles de análisis de texto, SMT se puede dividir en SMT basado en palabras y SMT basado en frases. Este último es muy utilizado actualmente y Google también lo utiliza. El texto traducido se divide automáticamente en secuencias de palabras de longitud fija y luego se realiza un análisis estadístico de cada secuencia de palabras en el corpus para encontrar la traducción con la mayor probabilidad correspondiente. Entonces, no odies a Google Translate. Si no confía en su propio motor de búsqueda potente para obtener un corpus relativamente grande, la calidad de la traducción puede ser incluso peor. Puede comparar Bing y Baidu. La traducción automática sin conexión de código abierto también se realiza bien, principalmente en modo estadístico.
Los derechos de autor pertenecen al autor.
Para reimpresiones comerciales, comuníquese con el autor para obtener autorización. Para reimpresiones no comerciales, indique la fuente.
Autor: Wang Bibi
Enlace:/question/24588198/answer/38342825
Fuente: Zhihu.
Existen otros métodos, como la traducción automática basada en instancias (EBMT), que son similares a los principios estadísticos. La diferencia es que el objeto de comparación es un corpus relativamente pequeño, del cual se encuentran ejemplos similares de fragmentos de traducción correspondientes, y luego las traducciones correspondientes se componen de la traducción automática basada en el contexto (CBMT); KBMT) y métodos híbridos, pero no tan altos como los dos primeros.
Estaba leyendo la descripción general de Daniel Stein sobre MT, “¿Mecánica? bersetzung-ein? Berblick", la traducción automática mencionada anteriormente tiene diferentes tipos y principios.