¿Puedes explicar mapreduce en hadoop?

Hola, déjame responderte:

MapReduce es una idea de procesamiento de datos, inventada por primera vez por Jeff Dean de Google y desarrollada por Yahoo! Doug Cutting implementó la versión de código abierto de MapReduce, que luego se convirtió en Hadoop.

Hadoop incluye un marco informático MapReduce de código abierto y un sistema de archivos distribuido: HDFS.

La esencia de MapReduce es el procesamiento paralelo, y mover programas es más rentable que mover datos.

Si solo hace algunas estadísticas simples (como contar, agrupar, ordenar por, promedio, máximo, mínimo, etc.), Hive será más adecuado para usted. Cuando importa todos los 500G a Hive, puede ingresar SQL directamente (estrictamente hablando, no es SQL, pero es realmente similar a SQL) en la línea de comando de Hive para ejecutar la consulta que desee.

Hive y Pig son herramientas de análisis de datos basadas en Hadoop y ambas dependen de Hadoop, pero Hadoop no se utiliza necesariamente para análisis de datos y estadísticas. Por ejemplo, Google lo utiliza para crear índices.

Si mi respuesta no te resulta útil, sigue preguntando.