Propuesta de objeto de lectura de papel de segmentación jerárquica de múltiples ramas

Este artículo proviene de BCMI y CVPR de la Universidad Jiao Tong de Shanghai 2015. Este es un consejo con secciones. Este artículo explora más a fondo el método de agregación regional basado en el prototipo de búsqueda selectiva.

La idea principal de los métodos de propuesta de objetos basados ​​en segmentación es combinar regiones de imágenes segmentadas para obtener regiones de objetos. Hay un problema: un error en el paso anterior provocará un error en el siguiente paso. Este método unidireccional de fusionar áreas divididas es defectuoso. Por lo tanto, este artículo utiliza un método de múltiples ramas para ampliar el alcance de la búsqueda y mejorar la precisión.

No es aconsejable utilizar simplemente una estrategia codiciosa para obtener el área objetivo buscando en el espacio del área dividida. Este documento adopta un principio para la fusión de áreas segmentadas: los objetivos complejos que contienen múltiples áreas de color y textura requieren diferentes estrategias de fusión para completar la fusión de áreas segmentadas. La idea principal de este artículo es combinar múltiples estrategias combinadas para mejorar la precisión de los métodos de búsqueda selectiva.

El contenido de investigación de este artículo consta principalmente de dos partes: estrategia de combinación de regiones multisegmentadas y búsqueda de regiones segmentadas.

(1) Aprendizaje de una estrategia de fusión complementaria

Este artículo resume el proceso de fusión de regiones en un clasificador lineal y entrena al clasificador cambiando el peso de cada muestra de entrenamiento (similar a Boosting proceso). Pero a diferencia de Boosting, el clasificador combinado regional propuesto en este artículo no combina múltiples clasificadores débiles en un clasificador fuerte, sino que forma un nuevo clasificador mediante la corrección de errores entre clasificadores.

(2) Rama de varias etapas

A través del clasificador de combinación de regiones anterior, se puede buscar la región de segmentación de imágenes y un paso de agregación codicioso se puede dividir en varios pasos.

Este artículo aumenta el espacio de búsqueda combinado de regiones segmentadas mediante organización de árbol y utiliza los resultados de la combinación de regiones para entrenar el clasificador SVM.

Este artículo utiliza ramas de árbol para organizar diferentes estrategias de combinación regional. Los métodos de división de las estrategias de combinación regional bajo la misma rama son los mismos.

Supongamos que la altura del árbol de agregación regional es t y el grado de cada nodo que no es hoja del árbol es k. Se pueden obtener resultados de agregación regional KT en la capa inferior. * * se puede obtener y se puede obtener una ventana de propuesta, donde λ representa el número de regiones dispersas agregadas en cada agregación de regiones, y n representa el número de regiones segmentadas que posee la imagen inicial. Puede utilizar λ y n para controlar el número final de sugerencias.

El proceso de generación de cada rama es en realidad un método de agregación codicioso, pero este proceso es jerárquico.

El punto anterior describió cómo bifurcar y luego usar un árbol de agregación de regiones de segmentación de imágenes para generar recomendaciones, principalmente cómo diseñar un clasificador de regiones de segmentación.

Para que el modelo de clasificación propuesto sea el mismo en diferentes ramas del árbol de agregación de regiones de segmentación de imágenes, se utiliza un clasificador lineal binario para clasificar las regiones de segmentación.

Es decir, diferentes áreas que pertenecen al mismo objeto se utilizan como ejemplos positivos y diferentes áreas que pertenecen a diferentes objetos se utilizan como ejemplos negativos para el entrenamiento. Luego se obtiene el clasificador SVM correspondiente.

Los datos de la imagen original del experimento provienen de PASCAL VOC2007. El algoritmo de segmentación de imágenes inicial y las características de la región de la imagen son exactamente los mismos que los de la búsqueda selectiva. Este artículo mejora principalmente el algoritmo de agregación regional.

Los algoritmos utilizados para la comparación son Búsqueda Selectiva (SS), Propuesta de Objeto Geográfico (GOP), Búsqueda Global y Local (GLS), Edge Box (EB) y Gradiente Normalizado Binarizado (Bing).

Los resultados experimentales se comparan de la siguiente manera:

Por el contrario, nuestro método no es muy diferente de la búsqueda selectiva (SS). Cuando el número de sugerencias es bajo, los resultados del cuadro de borde y la búsqueda selectiva son mejores que los métodos propuestos en este artículo. Cuando el número de sugerencias es grande, el método propuesto en este artículo tiene resultados ligeramente mejores.

La tabla anterior es una comparación de los resultados de reconocimiento de varios métodos más R-CNN en PASCAL VOC2007. Los parámetros de IoU en los casos de comparación no se especifican en el artículo. Como puede verse en la tabla, la precisión de recuperación del algoritmo propuesto en este artículo no es muy diferente de la búsqueda selectiva, y la mejora del algoritmo propuesto en este artículo es muy limitada.

La idea principal de este artículo es mejorar el método de búsqueda selectiva en el proceso de agregación de regiones de segmentación. Este artículo utiliza un método de agregación de árboles de múltiples capas para dividir el proceso de agregación codicioso único anterior en múltiples procesos de agregación codiciosos y utiliza SVM para clasificar regiones.

El método de agregación de regiones en forma de árbol utilizado en este artículo aumenta el espacio de búsqueda de la agregación de regiones divididas, pero sigue siendo una agregación codiciosa desde la perspectiva de un solo proceso, por lo que el artículo no mejora mucho la búsqueda selectiva y proporciona principalmente una agregación dividida. agregación de regiones nuevas ideas.

En comparación con los resultados experimentales, el método propuesto en este artículo es sólo ligeramente mejor que la búsqueda selectiva cuando el número de sugerencias es pequeño, pero su complejidad espacial es mucho mayor que la búsqueda selectiva y aumenta el tiempo. necesario para calcular el tiempo de sugerencias.

Búsqueda selectiva de reconocimiento de objetos. Revista Internacional de Visión por Computadora 104.2(2013):154-171.