Definir las características generales de Hadoop, en almacenamientos, gestión y consulta de datos con las herramientas Hive e Impala.
• Descripción de los Fundamentos Hadoop
-Identificación de Hadoop
-Aspectos generales de Hadoop
-Almacenamiento de datos: HDFS
-Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
-Procesamiento y análisis de datos: Hive, e Impala
-Integración de datos: Sqoop
-Otras herramientas de datos de Hadoop
-Explicación del escenario con ejercicios
• Explicación de Hive e Impala
-Definción de Hive
-Definción de Impala
-Descripción de Hive e Impala
-Schema y almacenamiento de datos
-Comparación entre Hive y las bases de datos tradicionales
-Casos de utilización
• Aplicación de Hive e Impala
-Tablas y bases de datos
-Sintaxis básica en consultas Hive e Impala
-Tipos de datos
-Hue para ejecutar consultas
-Beeline (la Shell de Hive)
- Shell de Impala
• Interés por la innovación tecnológica y a la formación en línea, siendo consciente de sus utilidades y de la necesidad de actualización permanente