1. Comprender los datos y utilizar muestreo estratificado.
Los datos son el núcleo para determinar toda la estrategia del proceso. La calidad de la imagen puede presentar complicaciones y debe manejarse con cuidado. Al realizar una búsqueda visual, es muy importante comprender las imágenes del directorio y las imágenes cargadas por los usuarios.
2. La mejora de los datos es clave, especialmente la rotación de imágenes.
La expansión de datos es un paso clave en el entrenamiento de redes neuronales cuando los datos de entrenamiento no pueden contener todos los cambios posibles en escenarios reales. Cuando un usuario captura un sujeto usando un teléfono móvil, es probable que la imagen se recorte, se gire, se desenfoque o no se escale al tamaño adecuado.
3. Utilice la información de supervisión tanto como sea posible al extraer firmas semánticas.
Como se mencionó anteriormente, es muy importante utilizar información de supervisión siempre que sea posible. Esto ayuda a entrenar al clasificador para que se centre en el contenido informativo e ignore otras áreas no informativas.
4. Análisis entropía de firmas
Este paso suele ignorarse en el diseño de sistemas de recuperación de información a gran escala. Es importante evaluar si una determinada capacidad de firma contiene suficiente información válida.
5. Cuando las etiquetas son etiquetas de grano grueso, la variación intraclase es muy importante.
Utilizamos etiquetas de categorías de hojas de grano grueso en lugar de ID de productos para entrenar la red neuronal. Parte de la razón es que, aunque la categoría de hojas es de grano grueso, es más fácil de obtener.
6. Utilice el método de eliminación para mejorar la velocidad y precisión de la búsqueda.
Especialmente diseñado para alta velocidad y precisión, el método de eliminación tiene poderosas capacidades. Por ejemplo, si la imagen de entrada contiene zapatillas, no es necesario buscar en el inventario de vestidos, mesas y computadoras.