Explicación de cortar y pegar: aprendizaje autosupervisado para detección y localización anónimas

Este artículo tiene como objetivo resolver un único problema de clasificación. Al aprender de muestras normales, se detectan tipos desconocidos de anomalías, lo que es más propenso a la detección de defectos. Método Todo el proceso se divide en dos pasos. Primero, la representación de la muestra se aprende basándose en un método de aprendizaje autosupervisado y luego se utiliza un único clasificador para clasificar la representación de la muestra. A través del CutPaste propuesto en este artículo se logra el aprendizaje de representación y clasificación de muestras normales. CutPaste es un método de mejora de datos que corta un área rectangular de la imagen y la pega en cualquier ubicación. El propósito del cortar y pegar es producir irregularidades espaciales como aproximaciones de defectos reales que no participan en el entrenamiento. Algunos métodos populares existentes aplican el aprendizaje por rotación y contraste a una sola clasificación, pero nuestros experimentos demuestran que el aprendizaje por rotación o contraste no es óptimo para la detección de defectos. Los autores sospechan que las transformaciones geométricas, como las rotaciones y los desplazamientos, son efectivas para aprender representaciones de conceptos semánticos (por ejemplo, objetos de aprendizaje), pero es menos probable que aprendan regularidades (por ejemplo, continuidad y repetición). Para la detección de defectos, este artículo espera proponer un método de aumento de datos para simular patrones irregulares locales.

La idea principal del algoritmo de detección de anomalías de clase única actual es entrenar un modelo que pueda representar muestras normales y asumir que este modelo no puede representar bien muestras anormales. Sin embargo, no se puede obtener información semántica de alto nivel basándose en la pérdida de reconstrucción a nivel de píxeles.

Este artículo adopta la idea de tareas de subterfugio en el aprendizaje autosupervisado. En la fase de representación del aprendizaje autosupervisado, se utiliza cortar y pegar para generar imágenes para muestras positivas, y se entrena una CNN binaria para identificar muestras e imágenes normales después de agregar cortar y pegar. En (b) la etapa de detección y localización de anomalías, se utiliza CNN para extraer características, y la estimación paramétrica de densidad de probabilidad gaussiana (GDE) utiliza las características extraídas por CNN para calcular la puntuación de anomalía. Para la detección de anomalías a nivel de imagen, puede usar GradCAM para ubicar aproximadamente el área anormal, usar el posicionamiento de anomalías a nivel de parche para dividir la imagen original en varios parches y enviarlos a CNN-GDE para calcular las puntuaciones de anomalía respectivamente, obteniendo así más imagen de anomalía de grano fino.

(La segunda etapa debe ser la puntuación de anomalía calculada directamente a partir de la representación de salida sin capacitación).

Se descubrió un fenómeno.

Aquellos que utilizan el aprendizaje autosupervisado contrastivo para la detección de anomalías (simclr, etc.) básicamente necesitan realizar un ajuste fino en la segunda etapa.

Si se utiliza otro aprendizaje autosupervisado para la detección de anomalías (por ejemplo, la tarea de subterfugio no utiliza el aprendizaje de contraste, pero identifica si la imagen está rotada), no es necesario realizar un ajuste fino en el segunda etapa.

Los métodos de mejora de datos cutpaste y cutpaste(scar) utilizados en este artículo están inspirados en recorte y cicatriz para agregar líneas delgadas. El experimento de aprendizaje autosupervisado real se considera tres problemas de clasificación: muestras normales, muestras con pasta cortada y muestras con pasta cortada (cicatriz).

Para el conjunto de datos MVTec AD, o las tareas reales de detección de defectos, los defectos generalmente incluyen deformación por tracción y estructuras de textura especiales. El propósito de utilizar cutpaste para muestras normales es simular muestras anormales mediante el uso de cutpaste. Al utilizar técnicas de visualización, los autores descubrieron que la distancia entre las muestras positivas después de agregar el cutpaste y las muestras positivas originales se hizo mayor, pero la proximidad a las muestras anormales reales se hizo más pequeña, lo que indica que aún se necesitan mejores métodos de mejora de datos.

Comparación experimental

Comparación experimental, localización de defectos

Experimentos de ablación de diferentes métodos de mejora de datos

(Aprendizaje y evaluación de clasificación Representación en la etapa de aprendizaje autosupervisado, los diferentes ángulos de rotación de la imagen se consideran categorías diferentes)

El autor cree que para diferentes tipos de conjuntos de datos, la tarea de subterfugio tiene un gran impacto en la combinación. Diferentes métodos de mejora de datos. Para conjuntos de datos semánticos, el efecto de rotación es mejor y para la detección detallada de defectos, el rendimiento de este documento es mejor. Los métodos de mejora de datos deben diseñarse en función de características anormales para enriquecer muestras que son significativamente diferentes de las muestras positivas, y es mejor mostrar las características de las muestras anormales.