La clasificación supervisada generalmente primero selecciona los datos estadísticos de muestras conocidas (áreas de entrenamiento) en la imagen, descubre los parámetros y condiciones de la clasificación, establece una función discriminante y luego toma una decisión sobre toda la imagen. o los píxeles a clasificar. Discriminación y clasificación. Los métodos de clasificación supervisada comúnmente utilizados en el procesamiento de imágenes de teledetección incluyen el método de distancia mínima, el método discriminante lineal y no lineal bayesiano (método de máxima verosimilitud), el método de segmentación multinivel (método de paralelopípedo), el método de curva característica (método de ángulo espectral), el método de carreras de caballos. método de distancia, método discriminante lineal de Fisher, etc.
1. Método de distancia mínima
El principio básico del método de distancia mínima es seleccionar parámetros de características y establecer una función discriminante basada en las características del patrón de categorías conocidas o muestras de entrenamiento, y utilice los píxeles a clasificar y La distancia del vector medio de cada categoría se compara y se divide en la categoría con la distancia más pequeña. Para garantizar la precisión de la clasificación, es necesario realizar una transformación ortogonal (como la transformación K-L, etc.) en el espacio de características. Primero, seleccione el área de muestra de entrenamiento en la pantalla de visualización de imágenes y encuentre la media y la desviación estándar de cada banda en el área de muestra de entrenamiento a partir de los datos de la imagen, luego calcule el vector de valor de brillo de otros píxeles al vector medio del espectro del entrenamiento; área. El índice de clasificación basado en este método es la distancia de valor absoluto o distancia euclidiana, entre las cuales la distancia euclidiana es la más utilizada. Si la distancia es menor que un umbral específico (generalmente un múltiplo de la desviación estándar) y la distancia a una determinada clase es la más cercana, el píxel se clasifica en una determinada clase. La precisión de este método de clasificación depende del número de áreas de muestra de entrenamiento (categorías de objetos de superficie) y de la precisión estadística del área de muestra. Debido a que es fácil de calcular y se puede escanear y clasificar uno por uno en orden de píxeles, el efecto de clasificación general también es bueno, por lo que es un método de clasificación supervisada de uso común.
Figura 4-23 Diagrama de bloques del método ISODATA
2. Método discriminante lineal y no lineal bayesiano (método de máxima verosimilitud)
Este método supone que cada categoría es general. La distribución de densidad de probabilidad es una distribución normal. Al comparar la probabilidad de que el píxel se clasifique con cada categoría, se divide en la categoría con mayor probabilidad. Su índice de clasificación es la tasa de verosimilitud (probabilidad condicional). Es una clasificación supervisada no lineal analizada utilizando el principio discriminante bayesiano. En pocas palabras, puede asumir una probabilidad previa conocida o determinada de los estándares típicos en el área de muestra de entrenamiento y luego resumir ciertas características en ciertos tipos de funciones. De acuerdo con la función de pérdida, el mejor resultado se obtiene cuando la pérdida es mínima. . Este método tiene un mejor efecto de clasificación, pero requiere una mayor cantidad de cálculos.
3. Método de segmentación multinivel (método del paralelopípedo)
El principio básico del método de segmentación multinivel es establecer una serie de puntos de segmentación en cada eje de variable característica en el espacio de características (Determine los puntos de segmentación según las características estadísticas de los datos de entrenamiento), divida el espacio de características multidimensional en subespacios que no se superpongan, cada subespacio corresponde a una categoría de clasificación y atribuya los píxeles clasificados a la categoría correspondiente a subespacio en el que se encuentra. Para mejorar la precisión de la clasificación, es necesario realizar una transformación ortogonal (como la transformación K-L, etc.) en el espacio de características.
4. Método de la curva característica (método del ángulo espectral)
El principio básico del método de la curva característica se basa en la similitud entre las curvas de los parámetros característicos de los objetos terrestres (como las espectrales). curvas características de objetos terrestres) El coeficiente (el coseno del ángulo entre los vectores de puntos de muestra en el espacio variable) se utiliza como índice discriminante de clasificación.
5. Método de distancia de Mahalanobis
El método de distancia de Mahalanobis considera completamente la matriz de covarianza que refleja las características de distribución de densidad de probabilidad aleatoria de los puntos de muestra en el espacio de variables multidimensionales. son ortogonales Es equivalente a la distancia euclidiana ponderada, por lo que este método generalmente tiene mejores efectos de clasificación y reconocimiento en comparación con métodos como el método de distancia mínima.
Los resultados de la clasificación supervisada son claros y la precisión de la clasificación es relativamente alta, pero los requisitos para las muestras de entrenamiento son relativamente altos, por lo que se deben prestar atención a las condiciones de aplicación al utilizar el discriminante establecido en. un área puede no ser adecuada para otras áreas. Totalmente aplicable. Además, a veces el área de entrenamiento no incluye completamente todos los patrones espectrales, lo que da como resultado algunos píxeles que no se pueden asignar. Por lo tanto, en el trabajo real, la clasificación supervisada y la clasificación no supervisada a menudo se utilizan juntas y se complementan entre sí, mejorando aún más la eficiencia y precisión de la clasificación.
La ventaja de la clasificación supervisada basada en el principio de máxima verosimilitud es que si el agrupamiento espacial presenta una distribución normal, entonces se reducirá el error de clasificación y la velocidad de clasificación será más rápida.
El principal defecto del método de clasificación supervisada es que el área de la muestra de entrenamiento con una naturaleza única de la muestra debe delinearse antes de la clasificación, y esto se puede hacer mediante el método no supervisado, es decir, un área determinada se agrupa en diferentes categorías individuales a través de El método no supervisado y el método supervisado luego usan estos. Una región de clase única "entrena" a la computadora. La clasificación de otras áreas se completa a través de una computadora "entrenada", evitando así el uso de métodos más lentos y no supervisados para clasificar toda el área de la imagen. La velocidad de clasificación mejora mientras se garantiza la precisión de la clasificación. Específicamente, siga los pasos a continuación.
El primer paso es seleccionar algunas áreas representativas para la clasificación no supervisada. Estas áreas incluyen en la medida de lo posible todas las clases de elementos de interés. La selección de estas áreas es contraria a los requisitos para la selección de áreas de muestra de entrenamiento para la clasificación supervisada, que deben ser lo más únicas posible. El área seleccionada aquí contiene tantas categorías como sea posible para que se puedan agrupar todas las categorías de características de interés.
El segundo paso es obtener conocimientos previos de múltiples categorías de clustering. Este conocimiento previo se puede obtener a través de la interpretación y la investigación de campo. Las categorías agrupadas sirven como parcelas de entrenamiento para la clasificación supervisada.
El tercer paso es la selección de funciones. Se selecciona la imagen característica más adecuada para su posterior clasificación.
El cuarto paso es utilizar el método de supervisión para clasificar toda la imagen. Diseñe un clasificador basado en el conocimiento previo obtenido en los pasos anteriores y los datos de muestra agrupados, y clasifique toda el área de la imagen.
El quinto paso es generar la imagen marcada. Dado que la información de categoría de la imagen se determina una vez completada la clasificación, la imagen completa se puede marcar como la categoría correspondiente para la salida.
El procesamiento de clasificación de imágenes se utiliza actualmente ampliamente en estudios de teledetección de agricultura, silvicultura y recursos terrestres. Para la clasificación de cuerpos geológicos, debido a los grandes factores de interferencia, las imágenes procesadas por transformación (transformación de relación, transformación K-L, etc.) generalmente se procesan para clasificación. Ahora se utilizan a menudo para mapeo litológico o mapeo de alteración hidrotermal. A medida que la tecnología de software y hardware se vuelve cada vez más madura, la clasificación informática de imágenes será cada vez más común.
Preguntas de repaso
1. ¿Cuál es el concepto básico de las imágenes digitales?
2. ¿Cuáles son los formatos de almacenamiento de las imágenes digitales?
3. ¿Cuáles son las estadísticas básicas de los datos de banda única y multibanda de teledetección?
4. ¿Cuáles son sus principales fuentes?
5. ¿Qué es la corrección de la atmósfera? Intente explicar los principios del análisis de regresión y la corrección del histograma.
6. Describe brevemente el proceso de corrección de precisión geométrica mediante el método de remuestreo.
7. ¿Qué son la transformación de proyección, el mosaico de imágenes y el encuadre de imágenes?
8. ¿Qué son la expansión lineal y la expansión no lineal? ¿Cuáles son los métodos de mejora no lineal más utilizados?
9. ¿Qué es la síntesis de color falso multibanda?
10. ¿Cuáles son las funciones básicas de mejora de proporciones y diferencias?
11. ¿Cuáles son los métodos comúnmente utilizados?
12. ¿Cuáles son las funciones principales de la transformación K-L y la transformación K-T?
13. ¿Qué es la clasificación no supervisada? ¿Cuántos métodos?
14. ¿Qué es la clasificación supervisada? ¿Cuántos métodos hay?
15. de cada condición.