Estadística: Los cursos universitarios incluyen regresión múltiple, correlación serial, econometría, encuestas por muestreo, etc. El modelo establecido debe centrarse en pruebas estadísticas y pruebas cuantitativas. El software utilizado es SAS/SPSS/EVIEWS, modelo: modelo de regresión, componente principal. La cantidad de datos no es necesariamente grande. ?
Minería de datos: el modelo no presta atención a las pruebas estadísticas ni a las pruebas cuantitativas. La cantidad de datos es relativamente grande. Software: Python/R/SAS. Modelo: bosque aleatorio, regresión logística, SVM, red neuronal (también hay algunos modelos de aprendizaje profundo, CNN, etc., alpha go usa CNN), componentes principales. Debe haber un conjunto de entrenamiento y un conjunto de prueba. La planificación existe desde hace muchos años, pero la minería de datos sólo recientemente se ha vuelto más avanzada. Siento que la minería de datos desarrolló parte de las estadísticas y luego agregó su propio contenido. Los estudiantes universitarios que se especializan en estadística en China tomarán cursos que no tienen nada que ver con la extracción de datos, como encuestas por muestreo. Además, con tantos años de experiencia en estadística, el profesor no ajustará fácilmente el curso, por lo que si está interesado en la minería de datos, estudie especialidades relacionadas.
Los métodos de muestreo y modelización estadística tradicionales son buenos, pero no conocen la situación actual del empleo. Solía sentir que el empleo no era optimista porque los modelos estadísticos tradicionales requerían que los médicos o las empresas tuvieran modelos maduros, que no eran fáciles de modificar. Por lo tanto, en el pasado pensé que para los graduados en estadística, se trataba más de análisis descriptivo. No se puede decir que siga siendo así ahora.
Recientemente vi a un estudiante universitario (que ha trabajado durante 3 años) publicar un anuncio de trabajo para un modelador de datos. Deben estar familiarizados con los modelos de minería de datos. Usan SAS/python/sql y el rango salarial es de 15K-30K. El salario se basa en la idoneidad laboral y la experiencia. De repente, siento que las estadísticas de empleo en China son bastante buenas ahora. Siempre que esté relacionado con la minería y el modelado de datos, en lugar de con estadísticas puramente descriptivas, el salario será mayor.