60 HORAS |
Diseñado y producido por:
Contenidos del curso
Conocimiento/capacidades cognitivas y prácticas
1. Descripción de los Fundamentos Hadoop
Identificación de Hadoop
Aspectos generales de Hadoop
Almacenamiento de datos: HDFS
Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
Procesamiento y análisis de datos: Hive, e Impala
Integración de datos: Sqoop
Otras herramientas de datos de Hadoop
Explicación del escenario con ejercicios
2. Explicación de Hive e Impala
Definción de Hive
Definción de Impala
Descripción de Hive e Impala
Schema y almacenamiento de datos
Comparación entre Hive y las bases de datos tradicionales
Casos de utilización
3. Aplicación de Hive e Impala
Tablas y bases de datos
Sintaxis básica en consultas Hive e Impala
Tipos de datos
Hue para ejecutar consultas
Beeline (la Shell de Hive)
Shell de Impala
HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES
Interés por la innovación tecnológica y a la formación en línea, siendo consciente de sus utilidades y de la necesidad de actualización permanente
Conocimiento/capacidades cognitivas y prácticas
1. Definición de operadores comunes y funciones integradas
Operadores
Funciones escalares
Funciones de agregación
2. Indicación de la administración de datos
Almacenamiento de datos
Creación de bases de datos y tablas
Carga de datos
Alteración de bases de datos y tablas
Simplificación de consultas con vistas
Almacenamiento de resultados de consultas
3. Síntesis sobre el Almacenamiento de datos y rendimiento
Partición de tablas
Carga de datos en tablas particionadas
Cuando utilizar las particiones
Elección del formato de archivo
Utilización de los formatos de archivo Avro y Parquet
HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES
Interés por las bases de datos y adquisición de técncas y habilidadades para la gestión y administración.
Conocimiento/capacidades cognitivas y prácticas
1. Aplicación de múltiples Datasets
UNION y Joins
Manejo de valores NULL en Joins
Joins avanzados
2. Utilización de Funciones analíticas y funciones de ventana
Utilización de funciones analíticas comunes
Otras funciones analíticas
Ventanas deslizantes
3. Gestión de Datos complejos
Datos complejos con Hive
Datos complejos con Impala
HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES
Coordinación y responsabilidad a la hora de aplicar funciones analíticas y de ventanas a los datos.
Conocimiento/capacidades cognitivas y prácticas
1. Aplicación del Análisis de texto
Expresiones regulares
Procesamiento de texto con SerDes en Hive
Análisis de Sentimiento y n-grams
2. Utilización de Optimización Hive
Rendimiento de las consultas
Bucketing
Indexación de datos
Hive con Spark
3. Gestión de Optimización de Impala
Ejecución de consultas
Mejorar el rendimiento de Impala
4. Formulación de preguntas sobre Hive e Impala
Customizar SerDes y formatos de archivo en Hive
Transformación de datos con Scripts personalizados en Hive
Funciones definidas por el usuario
Consultas parametrizadas
HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES
Implicación en la sintetización de expresiones regulares para realizar un análisis de textos.
Rigor en la aplicación de factores de optimización a Hive e Impala para la mejora del rendimiento en las consultas.
Conocimiento/capacidades cognitivas y prácticas
1. Resumen de la mejor opción
Comparación entre MapReduce, Hive, Impala y bases de datos relacionales
2. Síntesis de Apache Kudu
Descripción de Kudu
Tablas Kudu
Uso de Impala con Kudu
HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES
Coordinación con el resto del equipo que interviene en la gestión, seguimiento y evaluación de la formación y interés por por la integración de Apache Kudu en el marco de la herramienta Impala.
Demo
Programación
*La temática y el diseño de la demo son orientativos
Cursos Smartmind
¿Cómo son los cursos Smartmind?
Cursos con diseño profesional y contenido audiovisual interactivo en formato de licencia y cumplen 100% con las especificaciones del SEPE. Te presentamos los catálogos de cursos elearning en SCORM más completos y avanzados del mercado. Mejoramos hasta el 30% las finalizaciones de tus cursos, se incrementan hasta un 70% los alumnos que repiten y empresas como Endesa, Correos o Telefónica forman parte de nuestra cartera de clientes. ¿No crees que por algo será?
Cursos del Plan de Referencia que cumplen con los requisitos del SEPE y cuentan con el sello de diseño y calidad de Smartmind. Colaboramos con las más importantes empresas de formación en la selección de los mejores y más actuales para conseguir los mejores resultados.
¿Cómo funciona el
Catálogo?
¿Cómo funciona el
Catálogo?
Contenidos que se encuentra en la lista de espera de producciones de Smartmind y su ejecución depende de las peticiones de los clientes.
Formación disponible de forma inmediata en nuestros catálogos. Eso sí, se diferencian entre contenidos actuales y anteriores a 2021.
Formación no disponible por diferentes motivos: no recomentado o descatalogado
Todo lo que debes saber sobre los contenidos Smartmind
¿Quieres más información sobre este curso?
Rellena el formulario con tus datos y nos pondremos en contacto contigo para darte todos los detalles de nuestras licencias.
¡Qué bien! Necesitamos saber algunas cosas de ti :)
Déjanos tus datos y nos pondremos en contacto contigo para resolverte todas tus dudas.
¡Qué bien! Necesitamos saber algunas cosas de ti :)