Me fui a casa a descansar unos días durante el Dragon Boat Festival y trabajaré duro en junio~
Volver Según el texto, HOG es un método clásico de extracción de características de imágenes, especialmente en el campo del reconocimiento de peatones. Aunque el artículo se publicó en CVPR en 2005, vale la pena leer los artículos que no se han sumergido en los últimos diez años.
Idea clave:
La forma y apariencia de los objetos locales se pueden representar mediante gradientes locales o distribuciones de densidad en los bordes.
Pasos principales:
La imagen de arriba es la imagen proporcionada en el documento. Personalmente, creo que las imágenes que aparecen en el blog que figuran en Recursos podrían ser más fáciles de entender.
Detalles específicos:
La explicación detallada de cada proceso se ha escrito claramente en este blog, por lo que no entraré en detalles aquí.
El tamaño de la imagen del conjunto de datos en este artículo es: 64 * 128, el tamaño del bloque es 16x16, el tamaño del bloque es 8×8, el tamaño de la unidad es 8×8, bins=9 (número de capas de histograma);
Después de obtener la dimensión característica de cada imagen, use SVM lineal para entrenar el clasificador.
La siguiente imagen es un ejemplo dado por el autor:
Ambos blogs son muy buenos y se recomienda leerlos.