Estructura TTS de la síntesis de voz

Desde finales de la década de 1980, la tecnología de síntesis del lenguaje ha logrado nuevos avances, especialmente el método de adición sincronizada de tono (PSOLA) (1990), que ha mejorado en gran medida el timbre y la naturalidad del habla sintetizada mediante el método de empalme de formas de onda en el dominio del tiempo. A principios de la década de 1990, se habían desarrollado con éxito sistemas de conversión de texto a voz para francés, alemán, inglés, japonés y otros idiomas basados ​​en la tecnología PSOLA. La naturalidad de estos sistemas es superior a la de los sistemas anteriores de síntesis de texto basados ​​​​en el método LPC o ** sintetizador de picos. El sintetizador basado en el método PSOLA tiene una estructura simple, es fácil de implementar en tiempo real y tiene grandes perspectivas comerciales. .

La investigación nacional sobre la síntesis del habla china comenzó relativamente tarde, pero desde principios de la década de 1980 se ha desarrollado básicamente al mismo ritmo que la situación internacional. En términos generales, también ha pasado por el proceso de ** síntesis de picos, síntesis LPC y aplicación de tecnología PSOLA. Lenovo Good News (1995) contó con el apoyo del Programa Nacional 863, la Fundación Nacional de Ciencias Naturales, el Programa Nacional Clave y proyectos relacionados de la Academia de Ciencias de China. Th_conferencia de la Universidad de Tsinghua (1993); KDTALK (1995) de la Universidad de Ciencia y Tecnología de China y otros sistemas. Estos sistemas utilizan básicamente tecnología de empalme de formas de onda en el dominio del tiempo basada en el método PSOLA, y la inteligibilidad y claridad del chino mandarín sintetizado han alcanzado un alto nivel. Sin embargo, al igual que otros sistemas extranjeros de conversión de texto a voz, las frases y los textos sintetizados por estos sistemas tienen un fuerte sabor mecánico y no son lo suficientemente naturales como para ser ampliamente aceptados por los usuarios, lo que restringe la entrada a gran escala de esta tecnología en el mercado. mercado.