A diferencia de la tecnología de clasificación, la agrupación en clústeres es un tipo de aprendizaje no supervisado en el aprendizaje automático. En otras palabras, el clustering es un método de agrupamiento de información basado en el principio de similitud de información sin conocer de antemano las clases a clasificar. El propósito de la agrupación es hacer que las diferencias entre objetos que pertenecen a la misma categoría sean lo más pequeñas posible y las diferencias entre objetos en diferentes categorías lo más grandes posible. Entonces, el significado de agrupar es organizar el contenido observado en una estructura jerárquica y organizar cosas similares juntas. A través de la agrupación, se pueden identificar regiones densas y dispersas, descubriendo así patrones de distribución global y relaciones interesantes entre los atributos de los datos.
El análisis de clusters de datos es un campo en auge. La tecnología de agrupación se basa principalmente en métodos estadísticos, aprendizaje automático, redes neuronales y otros métodos. Las técnicas de agrupación típicas son métodos de agrupación basados en distancias geométricas, como la distancia euclidiana, la distancia de Mahatma y la distancia de Minkowski. El análisis de conglomerados se utiliza ampliamente en negocios, biología, geografía, servicios de redes y otros campos.