1. Conocimiento de vanguardia de big data e introducción a hadoop
Comience sin conceptos básicos, comprenda los antecedentes históricos y la dirección de desarrollo de big data. y dominar las dos configuraciones de instalación de hadoop.
Segundo, implementación avanzada de Hadoop
Competente en la construcción de clústeres de Hadoop; análisis en profundidad de HDFS, un sistema de archivos distribuido basado en la arquitectura Hadoop.
En tercer lugar, Fundación Java
Comprenda las ideas básicas de la programación Java, domine el uso de eclipse para una programación Java simple, domine el uso de archivos jar y comprenda los principios de la gestión de bases de datos. Sistemas como MySQL. Comprender el proceso de desarrollo de programas basados en web.
Cuarto, teoría y práctica de MapReduce
Estar familiarizado con los principios de funcionamiento y las aplicaciones de mapreduce, familiarizado con la programación básica de MapReduce y dominar el diseño y la redacción de proyectos basados en MapReduce basados en Los objetivos del análisis de big data.
Análisis de big data de V hadoop Mahout
Domine los escenarios de uso de los métodos de análisis de big data basados en hadoop mahout y utilice hábilmente los algoritmos maduros de mahout para analizar big data en escenarios específicos.
6. Teoría y práctica de Hbase
Domine el almacenamiento de datos y la práctica de proyectos de hbase, y domine los escenarios de instalación, configuración y uso de Spark y Hive.
7. Análisis de Big Data de Spark
Escenarios de instalación, configuración y uso de Spark, Hive, utilizan de manera competente los algoritmos maduros de Spark para realizar análisis de big data en escenarios específicos.
8. Reserva integral de conocimientos para el aprendizaje de big data
Estadística: análisis estadístico multivariado, regresión aplicada
Computadora: R, python, SQL, análisis de datos, máquina estudiar.
También es necesario dominar Matlab y Mathematica. El primero tiene grandes ventajas en aplicaciones prácticas de ingeniería y análisis de simulación, mientras que el segundo es excelente en funciones informáticas y análisis de modelos matemáticos. Los subsidios mutuos pueden complementarse entre sí.