1. Evite la influencia de datos anormales: a veces habrá algunos datos anormales en el conjunto de datos, que están muy fuera del grupo debido a errores de medición u otras razones, si no se eliminan. un gran impacto en los resultados de la investigación.
2. Mejorar la homogeneidad de los datos: Algunos datos pertenecen a diferentes subconjuntos, como género, edad, etc. Si no se eliminan, afectará el análisis de correlación entre variables.
3. Hacer que los datos se ajusten a la distribución normal: Muchos métodos de análisis estadístico se basan en el supuesto de que los datos satisfacen la distribución normal.