Paso 1: divide la oración original en partes. Primero, dividimos las oraciones en fragmentos simples, cada uno de los cuales se puede traducir fácilmente. Paso 2: busque todas las traducciones posibles para cada fragmento. A continuación, traduciremos cada palabra y lo haremos buscando los mismos fragmentos de todas las traducciones humanas en nuestra base de datos. Vale la pena señalar que no buscamos simplemente estos fragmentos en un simple diccionario de traducción. En cambio, vemos cómo personas reales traducen estas mismas palabras en oraciones reales. Esto nos ayuda a capturar todas las diferentes expresiones en diferentes contextos: incluso las frases más comunes tienen muchas traducciones posibles, algunas de las cuales se usan con más frecuencia que otras. Según la frecuencia con la que se produce cada traducción en nuestros datos de entrenamiento, podemos asignarle una puntuación. Por ejemplo, alguien dice "Quiero" significa "quiero", no "lo intento". Por lo tanto, podemos utilizar la frecuencia de "Quiero" traducida a "I want" en los datos de entrenamiento para darle más peso a la traducción de "I want".
Paso 3: Genera todas las oraciones posibles y encuentra la más probable. A continuación, combinaremos y generaremos una cadena de posibles oraciones utilizando cada posible traducción de estos fragmentos.