El reconocimiento de patrones se refiere al procesamiento y análisis de diversas formas de información (numérica, textual y lógica) que representan cosas o fenómenos, con el fin de describir, identificar, clasificar y explicar cosas o fenómenos. Es una parte importante de la ciencia de la información y la inteligencia artificial. El reconocimiento de patrones también suele denominarse clasificación de patrones. Desde la perspectiva de la naturaleza del problema y el método para resolverlo, el reconocimiento de patrones se puede dividir en clasificación supervisada y clasificación no supervisada. La principal diferencia entre los dos es si se conoce de antemano la categoría de cada muestra experimental. En términos generales, la clasificación supervisada a menudo requiere proporcionar una gran cantidad de muestras de categorías conocidas, pero en problemas prácticos esto es difícil, por lo que es necesario estudiar la clasificación no supervisada.
Los patrones también se pueden dividir en formas abstractas y concretas. Los primeros, como la conciencia, el pensamiento, la discusión, etc., pertenecen a la categoría de investigación de reconocimiento de conceptos y son otra rama de la investigación de la inteligencia artificial. Lo que llamamos reconocimiento de patrones se refiere principalmente al reconocimiento y clasificación de patrones específicos de formas de onda del habla, ondas sísmicas, electrocardiogramas, ondas cerebrales, imágenes, fotografías, texto, símbolos, biosensores y otros objetos.
La investigación sobre el reconocimiento de patrones se centra principalmente en dos aspectos. Una es estudiar cómo los objetos (incluidas las personas) perciben los objetos, lo que pertenece a la categoría de ciencia cognitiva. El segundo es la teoría y el método de cómo utilizar las computadoras para realizar el reconocimiento de patrones en tareas determinadas. El primero es el contenido de la investigación de fisiólogos, psicólogos, biólogos y neurofisiólogos, mientras que el segundo ha logrado resultados de investigación sistemática gracias a los esfuerzos de matemáticos, expertos en informática e informáticos en las últimas décadas.
Las computadoras se utilizan para identificar y clasificar un conjunto de eventos o procesos. Los eventos o procesos reconocidos pueden ser objetos concretos, como palabras, sonidos e imágenes, u objetos abstractos, como estados y grados. Estos objetos se diferencian de la información numérica, que se conoce como información de patrón.
El número de categorías clasificadas por reconocimiento de patrones está determinado por el problema de reconocimiento específico. A veces, el número real de categorías no se puede conocer al principio y el sistema de reconocimiento necesita observar repetidamente el objeto de reconocimiento antes de poder determinarlo.
El reconocimiento de patrones implica estadística, psicología, lingüística, informática, biología y cibernética. Está relacionado con la investigación sobre inteligencia artificial y procesamiento de imágenes. Por ejemplo, los sistemas de reconocimiento de patrones adaptativos o autoorganizados incluyen el mecanismo de aprendizaje de la inteligencia artificial; la comprensión del paisaje y el lenguaje natural en la investigación de inteligencia artificial también incluye el reconocimiento de patrones. Otro ejemplo es la aplicación de la tecnología de procesamiento de imágenes en el preprocesamiento y la extracción de características del reconocimiento de patrones; en el procesamiento de imágenes, la tecnología de reconocimiento de patrones también se utiliza en el análisis de imágenes.
1. Método de reconocimiento de patrones
1. Teoría y método de decisión
También conocido como método estadístico, es un método más temprano y maduro. Los objetos identificados se digitalizan primero y se convierten en información digital adecuada para el procesamiento informático. Los patrones suelen estar representados por grandes cantidades de información. Muchos sistemas de reconocimiento de patrones también realizan un preprocesamiento después de la digitalización para eliminar información de interferencia mixta y reducir cierta deformación y distorsión. Luego viene la extracción de características, que consiste en extraer un conjunto de características de un patrón de entrada digitalizado o preprocesado. La llamada característica es una métrica seleccionada que permanece sin cambios o casi sin cambios para la deformación y distorsión general, y contiene la menor información redundante posible. El proceso de extracción de características mapea patrones de entrada desde el espacio de objetos al espacio de características. En este momento, el patrón se puede representar mediante puntos o vectores de características en el espacio de características. Este mapeo no sólo comprime la cantidad de información, sino que también facilita la clasificación. La extracción de características ocupa una posición importante en la teoría de la toma de decisiones, pero actualmente no existe una guía teórica universal. La única forma de decidir qué característica seleccionar es analizando el objeto de reconocimiento específico. Después de la extracción de características, se puede clasificar, es decir, reasignar del espacio de características al espacio de decisión. Para ello, se introduce una función discriminante, el valor de la función discriminante correspondiente a cada categoría se calcula a través del vector de características y la clasificación se realiza comparando los valores de la función discriminante.
2. Método sintáctico
También conocido como método estructural o método lingüístico. La idea básica es describir un patrón como una combinación de subpatrones más simples, o como una combinación de subpatrones más simples, y finalmente obtener una descripción de la estructura de árbol. Los subpatrones más simples en la parte inferior se denominan primitivos de patrón. El problema de selección primitiva en el método sintáctico es equivalente al problema de selección de características en el método de la teoría de la decisión.
Normalmente, las primitivas elegidas deben proporcionar descripciones compactas de patrones que reflejen sus relaciones estructurales y sean fáciles de extraer mediante métodos no gramaticales. Obviamente, los primitivos en sí no deberían contener información estructural importante. Un patrón se describe mediante un conjunto de primitivas y sus combinaciones, llamadas declaraciones de descripción de patrones, que equivalen a la combinación de palabras y caracteres en oraciones y frases de un idioma. Las reglas para los patrones de combinación primitivos están especificadas por las llamadas gramáticas. Una vez identificada la primitiva, el proceso de identificación se puede realizar mediante análisis sintáctico, es decir, se analiza si la oración patrón dada se ajusta a la gramática prescrita, y las que se ajustan a una determinada gramática se clasifican en esta categoría.
La elección del método de reconocimiento de patrones depende de la naturaleza del problema. Si el objeto a reconocer es extremadamente complejo y contiene información estructural rica, generalmente se usa el método sintáctico; si el objeto a reconocer no es muy complejo o no contiene información estructural obvia, generalmente se usa el método de la teoría de la decisión; Los dos enfoques no pueden separarse completamente. En el enfoque sintáctico, las primitivas mismas se extraen mediante la teoría de la decisión. En la aplicación, combinar estos dos métodos y aplicarlos a diferentes niveles a menudo puede lograr mejores resultados.
2. Aplicaciones del reconocimiento de patrones
El reconocimiento de patrones se puede utilizar para el reconocimiento de caracteres y de voz, la teledetección y el diagnóstico médico.
①Reconocimiento de caracteres
Los caracteres chinos tienen una historia de miles de años y también son los caracteres más utilizados en el mundo. Han hecho una contribución indeleble a la formación y desarrollo del mundo. espléndida cultura de la nación china. Por lo tanto, con la creciente popularidad de la tecnología de la información y la tecnología informática, la forma de ingresar caracteres en las computadoras de manera conveniente y rápida se ha convertido en un importante cuello de botella que afecta la eficiencia de las interfaces persona-computadora, y también está relacionado con si las computadoras realmente pueden usarse ampliamente en nuestro país. En la actualidad, la entrada de caracteres chinos se divide principalmente en entrada manual por teclado y entrada automática por reconocimiento automático. Entre ellos, la escritura manual es lenta y requiere mucha mano de obra; la entrada automática se divide en entrada de reconocimiento de caracteres chinos y entrada de reconocimiento de voz. En términos de la dificultad de la tecnología de reconocimiento, el reconocimiento de escritura a mano es más difícil que el reconocimiento de letra impresa, y en el reconocimiento de escritura a mano, la escritura fuera de línea es mucho más difícil que el reconocimiento de escritura a mano en línea. Hasta ahora, además de la aplicación práctica del reconocimiento de dígitos escritos a mano sin conexión, el reconocimiento de caracteres chinos escritos a mano sin conexión aún se encuentra en la etapa de laboratorio.
②Reconocimiento de voz
Los campos involucrados en la tecnología de reconocimiento de voz incluyen: procesamiento de señales, reconocimiento de patrones, teoría de la probabilidad y teoría de la información, mecanismo vocal y mecanismo auditivo, inteligencia artificial, etc. En los últimos años, en el campo de la tecnología biométrica, la tecnología de reconocimiento de huellas de voz ha atraído una amplia atención en todo el mundo debido a sus ventajas únicas como conveniencia, economía y precisión, y se ha convertido cada vez más en un método de verificación de seguridad importante y popular en la vida diaria de las personas. y trabajo. Además, el método de reconocimiento de voz que utiliza algoritmos genéticos para entrenar el modelo de Markov oculto continuo se ha convertido en la tecnología principal de reconocimiento de voz. Este método tiene una velocidad de reconocimiento rápida y una alta tasa de reconocimiento en el reconocimiento de voz.
③Reconocimiento de huellas dactilares
La piel desigual de las superficies internas de las palmas de las manos, los dedos de las manos, los pies y los pies formará varios patrones. Estas líneas de piel son únicas en sus patrones, rupturas e intersecciones. Basándose en esta singularidad, se puede asociar a una persona con su huella digital y se puede verificar su verdadera identidad comparando su huella digital con huellas dactilares previamente almacenadas. Generalmente, las huellas dactilares se dividen en las siguientes categorías: tipo anillo, tipo espiral y tipo arco, de modo que las huellas dactilares de cada persona puedan clasificarse y buscarse individualmente. El reconocimiento de huellas dactilares se puede dividir básicamente en varios pasos principales: preprocesamiento, selección de características y clasificación de patrones.
③Detección Remota
El reconocimiento de imágenes por teledetección se ha utilizado ampliamente en campos como la estimación del rendimiento de los cultivos, la exploración de recursos, la previsión meteorológica y el reconocimiento militar.
④Diagnóstico médico
El reconocimiento de patrones ha logrado resultados en la detección de células cancerosas, fotoanálisis de rayos X, análisis de sangre, análisis de cromosomas, diagnóstico de electrocardiograma, diagnóstico de electroencefalograma, etc.
En tercer lugar, el reconocimiento estadístico de patrones
El principio básico del reconocimiento estadístico de patrones es que muestras similares están cerca unas de otras en el espacio de patrones y forman un "grupo", es decir, " dios los cría y ellos se juntan." El método de análisis consiste en dividir el patrón dado en c categorías ω1, ω2,...,ωc según el vector característico Xi = (xi 1, xi2,..., xid) t (i = 1, 2,.. .n) Medido por patrones y luego en función de la distancia entre patrones. donde t representa la transposición; n es el número de puntos de muestra; d es el número de características de muestra.
Los principales métodos de reconocimiento de patrones estadísticos incluyen el método de función discriminante, el método de clasificación del vecino más cercano, el método de mapeo no lineal, el método de análisis de características y el método de análisis de factor principal.
En el reconocimiento de patrones estadísticos, las reglas de decisión bayesianas resuelven teóricamente el problema del diseño óptimo del clasificador, pero su implementación debe resolver primero el problema más difícil de la estimación de la densidad de probabilidad. La red neuronal BP aprende directamente de los datos de observación (muestras de entrenamiento) como un método más simple y efectivo, por lo que se ha utilizado ampliamente, pero es una tecnología heurística y carece de una base teórica sólida para la práctica de ingeniería específica. Los avances en la investigación de la teoría de la inferencia estadística han llevado al establecimiento de una teoría moderna del aprendizaje estadístico: la teoría VC, que no solo responde satisfactoriamente a preguntas teóricas en redes neuronales artificiales basadas en matemáticas estrictas, sino que también deriva un nuevo método de aprendizaje: la máquina de vectores de soporte (SVM). .
En cuarto lugar, la tecnología de reconocimiento de patrones tiene un potencial de desarrollo casi ilimitado.
La tecnología de reconocimiento de patrones es la tecnología básica de la inteligencia artificial. El siglo XXI es un siglo inteligente, informatizado, informatizado y en red. En este siglo caracterizado por la informática digital, la tecnología de reconocimiento de patrones, como tema básico de la tecnología de inteligencia artificial, seguramente ganará un enorme espacio para el desarrollo. A nivel internacional, las principales instituciones de investigación autorizadas y las principales empresas han comenzado a prestar atención a la tecnología de reconocimiento de patrones y la consideran el foco estratégico de investigación y desarrollo de la empresa.
1. Tecnología de reconocimiento de voz
La tecnología de reconocimiento de voz se está convirtiendo gradualmente en una tecnología clave para la interfaz persona-computadora en la tecnología de la información. La aplicación de la tecnología del habla se ha convertido en una alta tecnología emergente competitiva. industria. . Pronóstico del mercado del Centro de Internet de China: En los próximos cinco años, la capacidad del mercado de tecnología de voz de China superará los 40 mil millones de yuanes y crecerá a una tasa anual de más del 30% a partir de entonces.
2. Tecnología de autenticación biométrica
La tecnología de autenticación biométrica es la tecnología de autenticación de seguridad más preocupada en este siglo, y su desarrollo es la tendencia general. La gente está dispuesta a olvidar todas las contraseñas y desechar todas las tarjetas magnéticas, confiando en la unicidad para identificarse y mantener la confidencialidad. International Data Group (IDC) predice que la tecnología biométrica, como tecnología básica del comercio electrónico móvil, alcanzará un tamaño de mercado de mil millones de dólares en los próximos 10 años.
3. Tecnología de marca de agua digital
La marca de agua digital es la tecnología de protección de derechos de autor de medios digitales más potencial y ventajosa desarrollada internacionalmente desde la década de 1990. IDC predice que la capacidad del mercado global de tecnología de marcas de agua digitales superará los 8 mil millones de dólares en los próximos cinco años.
Verbo (abreviatura de verbo) Conclusión
Desde el desarrollo del reconocimiento de patrones en la década de 1920, ha existido la opinión común de que ningún modelo ni tecnología pueden resolver todos los problemas. problema de reconocimiento. Todo lo que tenemos ahora es una bolsa de herramientas. Lo que debemos hacer es combinar la identificación estadística y sintáctica con problemas específicos, y combinar el reconocimiento de patrones estadísticos o sintácticos con la búsqueda heurística en inteligencia artificial. Combinando el reconocimiento de patrones estadísticos o el reconocimiento de patrones sintácticos con el aprendizaje automático de máquinas de vectores de soporte, combinando redes neuronales artificiales con varias tecnologías existentes, sistemas expertos y métodos de razonamiento incierto en inteligencia artificial, podemos comprender en profundidad las capacidades de varias herramientas. aprender de las fortalezas de los demás y crear una nueva situación en las aplicaciones de reconocimiento de patrones.
Existen diversas explicaciones teóricas sobre la capacidad de reconocer patrones bidimensionales. La teoría de las plantillas sostiene que cada patrón que conocemos tiene una plantilla correspondiente, o copia en miniatura, en la memoria a largo plazo. El reconocimiento de patrones consiste en hacer coincidir las plantillas que mejor se adaptan a un estímulo visual. Según la teoría de las características, los estímulos visuales se componen de varias características y el reconocimiento de patrones consiste en comparar las características del estímulo con las características almacenadas en la memoria a largo plazo. La teoría de características explica algunos procesos ascendentes en el reconocimiento de patrones, pero no enfatiza el procesamiento de información de arriba hacia abajo y las expectativas basadas en el entorno. Una teoría basada en la descripción estructural puede ser más apropiada que la teoría de plantillas o la teoría de características.