Tres aspectos del procesamiento de señales de voz y sus respectivos objetivos:
1.
La síntesis de voz está diseñada para permitir que las computadoras produzcan un habla continua de alta calidad y muy natural. El sistema de síntesis de voz por computadora, también conocido como sistema de texto a voz (TTS), convierte principalmente texto en voz. Proceso de desarrollo: *** Síntesis Zhenfeng, síntesis LPC, tecnología PSOLA.
2. Codificación del habla.
En el proceso de transmisión de señales de voz, el uso racional de los recursos de frecuencia es muy valioso, por lo que antes de la transmisión, la señal de voz primero se codifica y comprime.
3. Reconocimiento de voz.
El reconocimiento de voz involucra lingüística, informática, procesamiento de señales, fisiología y otras disciplinas relacionadas, y es una rama del reconocimiento de patrones. Su objetivo principal es permitir que la computadora traduzca la voz en comandos ejecutables o texto mediante el reconocimiento y la comprensión.
Principales direcciones de investigación: sistema de reconocimiento de voz aislado, sistema de reconocimiento de voz conectivo y sistema de reconocimiento de voz continuo según la forma de hablar. Según el ponente, el sistema de reconocimiento de personas característico y el sistema de reconocimiento de personas no característico. Según el vocabulario, sistema de reconocimiento de voz de vocabulario pequeño, sistema de reconocimiento de voz de vocabulario medio, sistema de reconocimiento de voz de vocabulario grande, sistema de reconocimiento de voz infinito.