Principios básicos de los chips de reconocimiento de voz

Todos los sistemas de reconocimiento de voz integrados utilizan el principio de coincidencia de patrones. Primero se preprocesa la señal de voz de entrada, incluido el muestreo de la señal de voz, el filtrado antialiasing y la mejora de la voz. A continuación se realiza la extracción de características, que se utiliza para extraer uno o más conjuntos de parámetros que pueden describir las características de la señal de voz de la voz. forma de onda de la señal. Los datos después de la extracción de características generalmente se dividen en dos pasos. El primer paso es la etapa de "aprendizaje" o "entrenamiento" del sistema. La tarea de esta etapa es construir una biblioteca de patrones de referencia. , que consiste en Esta palabra se pronuncia varias veces y se obtiene mediante extracción de características y algún tipo de entrenamiento. La segunda es la etapa de "reconocimiento" o "prueba". De acuerdo con ciertos criterios, se obtiene la medida de distorsión entre los parámetros de las características del habla que se van a probar y la información del habla y la plantilla correspondiente en la biblioteca de patrones. resultado.