1 Teoría y modelo de segmentación de clientes
1.1 Teoría de segmentación de clientes
La segmentación de clientes se refiere a la segmentación de En un mercado específico, los clientes se dividen en grupos con diferentes necesidades de consumo de seguros en función de sus características básicas, características de comportamiento y características de valor. La segmentación puede ayudar a las empresas a descubrir clientes de alto valor y clientes potenciales, diferenciar entre clientes leales y clientes propensos a abandonar y ofrecer productos y servicios de seguros de manera específica. Existen varias formas de segmentar a los clientes, las principales son las siguientes:
1) Detalles demográficos: sexo, edad, registro del hogar, ocupación, ingresos, nivel educativo, etc.
2) Segmentación en función del valor del cliente: primas pagadas, primas remitidas, primas medias a destajo, etc.
3) Segmentación en función del comportamiento del cliente: fecha de primera contratación de póliza, fecha de última contratación de póliza, tipo de seguro contratado, etc.
4) Segmentación en función de las actitudes de los clientes: sensibilidad a las tarifas, satisfacción con los servicios, reconocimiento de las empresas, etc. Debido a que varios métodos de segmentación solo se acercan a una dimensión, la caracterización posterior de los clientes causará problemas relativamente simples y unilaterales. Por lo tanto, este artículo agrupa tres métodos de segmentación basados en la demografía, el valor y el comportamiento, y finalmente consolida los resultados. En cuanto al método de segmentación basado en las actitudes de los clientes, no lo consideraremos por el momento debido a la dificultad para obtener datos.
1.2 Modelo de segmentación de clientes
La segmentación de clientes generalmente utiliza métodos de minería de datos de agrupación para construir modelos. El método de agrupación se refiere a agrupar registros de datos según su similitud, de modo que las diferencias entre grupos sean obvias y los datos del mismo grupo sean lo más similares posible. En este caso, la agrupación agrupa a clientes similares mientras se maximizan las diferencias entre los diferentes grupos de clientes así formados. Los métodos de agrupación comúnmente utilizados incluyen: agrupación basada en particiones, agrupación jerárquica, agrupación basada en densidad, etc. Este artículo utiliza el algoritmo K-MEANS para agrupar en función de la escala de datos real y la eficiencia del procesamiento.
2. Segmentación de clientes de seguros de vida basada en algoritmo de clustering
2.1 Preparación de datos
Utilizando una tabla de asegurados de seguros de vida de un mes de ancho como grupo de fotos. , según Se tomaron alrededor de 10 muestras aleatorias, lo que generó alrededor de 654,38 millones de clientes para el modelaje. Los campos cubren información básica del cliente, información de valor del asegurado, información de comportamiento del asegurado, información de compra de productos del asegurado, etc. , y cuenta con más de 400 campos.
2.2 Exploración de datos
Después de obtener los datos, primero debe explorar los datos que necesitan ser modelados. Generalmente, según el tipo de campo, la exploración de datos utiliza análisis de distribución para campos de caracteres y análisis de concentración y dispersión para campos numéricos (incluyendo media, mediana, varianza, cuantil, etc.). ). El objetivo principal es ver si a la variable de entrada le faltan valores, valores únicos, valores excesivos de un determinado tipo, valores extremos, etc. Combinado con el análisis de conglomerados posterior, este artículo elimina directamente los campos con valores faltantes superiores a 20, los campos de un solo valor y los campos de una sola categoría con valores excesivos, y elimina todos los registros con valores extremos.
2.3 Detección de variables
Después del procesamiento anterior, las variables restantes son aproximadamente 100. Clasifique y filtre variables según la demografía, el valor del cliente y el comportamiento del cliente. 1) Método demográfico: utilice la edad del cliente como variable de segmentación. Porque los clientes de diferentes grupos de edad a menudo tienen diferentes necesidades de seguro, y la edad también puede reflejar indirectamente la etapa del ciclo de vida y el nivel de consumo del cliente. Por tanto, la edad se divide directamente en los siguientes cinco segmentos: 19-30 años, 31-40 años, 41-50 años, 51-60 años y mayores de 60 años, correspondientes a cinco grupos de usuarios. 2) Método del valor del cliente: mide el valor de la prima de los asegurados. Esta parte tiene muchas variables y requiere una reducción de dimensionalidad. El método principal consiste en encontrar variables altamente correlacionadas y agruparlas mediante análisis de correlación, análisis de componentes principales y agrupación de variables. En cada categoría se seleccionan 1-2 variables representativas con base en el índice de proporción 1-R * * 2 y la experiencia del personal empresarial. Finalmente se seleccionaron cuatro variables: prima unitaria, prima pagada, prima impaga y prima mayorista. 3) Comportamiento del cliente: Mide el comportamiento del asegurado. Nuevamente, esta parte contiene muchas variables y requiere reducción de dimensionalidad.
El método específico es el mismo que el anterior. Las variables finales seleccionadas son las siguientes: el momento en que se compró la póliza por primera vez, el número de pólizas, el número de compras de seguros, el número de pólizas compradas para otros y el número de pólizas compradas para diferentes tipos de seguros.
2.4 Establecimiento y prueba del modelo
Utilice el software SPSS y utilice el método de agrupamiento rápido K-MEANS para agrupar las variables de valor y las variables de comportamiento anteriores. Dado que K-MEANS necesita establecer la cantidad de grupos por adelantado, generalmente puede aumentar la cantidad de grupos desde el valor inicial de 4 y observar los resultados de la agrupación para su evaluación. La evaluación de la agrupación se puede considerar principalmente desde los dos aspectos siguientes: 1) Valor de silueta: SPSS selecciona el valor de la silueta para evaluar la calidad de la agrupación. Para diferentes números de grupos de conglomerados, podemos obtener sus anchos de contorno respectivamente. En términos generales, los valores mayores son mejores. Si supera 0,5, se considera un buen resultado de clasificación, y si es inferior a 0,2, indica una falta de estructura de agrupamiento sustancial. 2) Análisis empresarial: analizar los resultados de agrupación de empresas. Prueba si existen diferencias significativas en las medias o distribuciones de variables de agrupamiento entre diferentes clases para medir las diferencias entre clases. Además, la explicabilidad empresarial también es un criterio importante.
2.5 Aplicación e implementación
Integre la información demográfica de los clientes mencionados anteriormente (por edad, 5 categorías), el valor del cliente (5 categorías) y el comportamiento del cliente (6 categorías). Finalmente, se formaron 25 grupos para marketing dirigido.
3 Resumen y perspectivas
Para compensar las únicas deficiencias de la segmentación de clientes anterior, este artículo divide a los clientes en tres dimensiones: información demográfica del cliente, información de valor del cliente y comportamiento del cliente. Utilice el algoritmo K-MEANS para una agrupación rápida y combine eficazmente los resultados finales para proponer las estrategias de marketing y los planes de promoción de productos correspondientes. La eficacia del marketing de seguros no sólo está relacionada con la elección del cliente, sino que la estrategia de marketing, los canales de marketing y el tiempo de marketing también son factores importantes que afectan la tasa de éxito. Posteriormente, podemos combinar los resultados de la segmentación con el sistema push para analizar más a fondo las preferencias de canal de los clientes.
;