Internautas entusiastas
El concepto de análisis de conglomerados proviene principalmente del análisis estadístico multivariado. Por ejemplo, considere que hay muchos puntos dispersos en un sistema de coordenadas bidimensional. los puntos dispersos deben analizarse. Una clasificación razonable requiere conocimiento de agrupación. El método de análisis de agrupamiento difuso se dirige principalmente al problema de que los elementos en el espacio muestral P contienen múltiples atributos y es necesario que los elementos estén razonablemente clasificados. Finalmente, se puede presentar en forma de un diagrama de clúster, y el diagrama de clúster se puede generar manual o automáticamente. Aquí se utiliza el método de generación automática, que también es un enlace clave en el proceso de implementación del programa de este artículo.
El proceso principal de la agrupación difusa básica implementada aquí son algunos métodos documentados, que se describen brevemente a continuación:
Para clasificar un conjunto de muestra U=, deje que cada elemento de tiene m indicadores, por lo que la muestra puede describirse mediante un vector m-dimensional, es decir: ui=(i=1, 2,..., n). Luego, la agrupación difusa correspondiente se lleva a cabo de acuerdo con los siguientes pasos: 1)
Procesamiento de estandarización, comprimir los datos al intervalo (0-1). Esta parte es relativamente simple y no se presentará brevemente. (Consulte [1]) 2)
Establecimiento de relaciones difusas: uno de los vínculos más importantes aquí es establecer primero una matriz de similitud difusa basada en la "distancia" u otros puntos de vista y métodos de comparación. distancia" "Hay: Hamming
Distancia:
d(i, j)=sum(abs(x(i,k)-x(j,k)))
|
k
de
1
a
m
(|
k
de
1
a
m representa el coeficiente en la fórmula de suma k aumenta de 1 a m, lo mismo a continuación) Euclides
Distancia:
d(i, j)=sum((x(i,k)-x( j,k) )^2)
|
k
de
1
a p>
m
Dentro de los métodos no distanciados, el más clásico es el método del ángulo coseno:
Progresión final