IFCD0056

Administración de Cloudera para apache hadoop

60 HORAS | 

Especialidades formativas del sepe

Usar clúster Cloudera para instalar Cloudera Manager y CDH, ejecutar la ingesta de datos de fuentes externas en un clúster, detección, solución y reparación de problemas, así como manejar las funciones de seguridad Key Cloudera.

Diseñado y producido por:

Contenidos del curso

CURSO IFCD0056 Administración de Cloudera para apache hadoop

Conocimiento/capacidades cognitivas y prácticas

1. Identificación del entorno Cloudera Enterprise Data

Cloudera Enterprise Data Hub

Descripción general de CDH

Descripción general de Cloudera Manager

Responsabilidades del administrador de Hadoop

2. Construcción y ejecución de Cloudera Manager y CDH

Descripción general de la instalación de un Clúster

Experimentación con Cloudera Manager

Instalación de CDH

Servicios CDH Clúster

3. Análisis de un Clúster de Cloudera

Descripción general

Parámetros de configuración

Modificación de configuraciones de servicio

Ficheros de configuración

Administración de Role Instances

Añadir nuevos servicios

Añadir y extraer hosts

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Adquisición de los conocimientos necesarios para manejar las herramientas de Cloudera y diseñar un clúster.

Rigor en el uso de este sistema e interés por arquitecturas de datos más actuales.

Conocimiento/capacidades cognitivas y prácticas

1. Gestión del sistema de ficheros distribuidos de Hadoop.

Descripción general

Topología de HDFS y roles

Edición de logs y puntos de control

Rendimiento de HDFS y tolerancia a errores

Descripción general de seguridad HDFS y Hadoop

Interfaces de usuario web por HDFS

Utilización de la interfaz de línea de pedidos HDFS

Otras utilidades de línea de órdenes

2. Observación y recolección de datos con HDFS

Información general de recolección de datos

Formatos de ficheros

Recolección de datos mediante la transferencia de archivos o interfaces

REST

Importación de datos de bases de datos relacionales con Apache Sqoop

Recopilación de datos de fuentes externas con Apache Flume

Mejores prácticas para la importación de datos

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Adquisición de los conocimientos imprescindibles para manejar ficheros de Hadoop y recolectar datos de fuentes externas.

Curiosidad por las nuevas tecnologías y su desarrollo

Conocimiento/capacidades cognitivas y prácticas

1. Descripción y utilización de las herramientas Hive e Impala

Apache Hive

Apache Impala

2. Análisis y utilización de las herramientas YARN i MapReduce

Composición general de YARN, ejecución y visualización de logs y aplicaciones con YARN.

Aplicaciones de MapReduce

Configuración de memoria y CPU de YARN

3. Exposición y experimentación con la herramienta Apache Spark

Composición general de Spark, aplicaciones Spark con YARN

Monitorización de aplicaciones Spark

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Asimilación de los conocimientos necesarios para gestionar herramientas asociadas a Hadoop.

Coordinación con el resto del equipo que interviene en la gestión, seguimiento y evaluación de la formación.

Responsabilidad en el uso de las herramientas YARN i MapReduce.

Conocimiento/capacidades cognitivas y prácticas

1. Gestión de un Clúster

Consideraciones generales de planificación

Escoger el hardware adecuado

Consideraciones de red

Opciones de virtualización

Opciones de implementación Cloud

Manipulación de nodos

2. Utilización avanzada del clúster

Configuración de puertos de servicio

Modificar HDFS y MapReduce

Habilitar alta disponibilidad en HDFS

3. Gestión de recursos

Composición de cgroups con Static Service Pools

El Fair Scheduler

Formulación de Dynamic Resource Pools

Programación de consultas en Impala

4. Caracterización de un Clúster

Comprobación del estado de HDFS

Copia de datos entre Clústeres

Rebalanceo de datos en HDFS

Instantáneas del directorio HDFS

Actualización de un clúster

5. Observación de Clústeres

Funciones de monitorización de Cloudera Manager

Pruebas de salud

Acontecimientos y alertas

Gráficos e informes

Recomendaciones de monitorización

6. Experimentación y análisis de problemas de un clúster

Descripción general

Herramientas de resolución de problemas

Ejemplos de mala configuración

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Atención a los puntos básicos para gestionar, de forma integral, un clúster.

Disposición a resolver y diagnosticar los problemas que pueda generar la gestión del clúster.

Conocimiento/capacidades cognitivas y prácticas

1. Creación y gestión de Hue

Descripción general

Administración y configuración de Hue

Autenticación y autorización a Hue

2. Observación de la seguridad

Conceptos de seguridad en Hadoop

Autenticación en Hadoop mediante Kerberos

Autorización a Hadoop

Cifrado en Hadoop

Securización de un clúster de Hadoop

3. Descripción de Apache Kudu

Descripción general de Kudu

Arquitectura

Instalación y configuración

Herramientas de monitorización y administración

4. Análisis de Apache Kafka

¿Qué es Apache Kafka?

Descripción general de Apache Kafka

Arquitectura de un Clúster Apache Kafka

Herramientas de línea de mandos Apache Kafka

Uso de Kafka con Flume

5. Gestión del almacenamiento de objetos Cloud

Almacenamiento de objetos

Conexión de Hadoop con el almacenamiento de objetos

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Asimilación de los conocimientos necesarios para manejar las herramientas Hue, Kudu, Kafka, gestionar la seguridad y el almacenamiento de objetos.

Coordinación con el resto del equipo que interviene en la gestión, seguimiento y evaluación de la formación.

Demo

Programación

*La temática y el diseño de la demo son orientativos

Cursos Smartmind

¿Cómo son los cursos Smartmind?

Cursos con diseño profesional y contenido audiovisual interactivo en formato de licencia y cumplen 100% con las especificaciones del SEPE. Te presentamos los catálogos de cursos elearning en SCORM más completos y avanzados del mercado. Mejoramos hasta el 30% las finalizaciones de tus cursos, se incrementan hasta un 70% los alumnos que repiten y empresas como Endesa, Correos o Telefónica forman parte de nuestra cartera de clientes. ¿No crees que por algo será?

Más cursos de especialidades formativas

Cursos del Plan de Referencia que cumplen con los requisitos del SEPE y cuentan con el sello de diseño y calidad de Smartmind. Colaboramos con las más importantes empresas de formación en la selección de los mejores y más actuales para conseguir los mejores resultados.

¿Cómo funciona el

Catálogo?

Todo lo que debes saber sobre los contenidos Smartmind

catalogo-elearning-smartmind.j

Edtech

¿Cómo funciona el catálogo elearning de Smartmind?

programas-formativos-exito

Desarrollos a medida

¿Por qué las licencias de los cursos on line en formato SCORM de Smartmind son la mejor opción para el éxito de tus programas formativos?

diseño de cursos elearning a medida

Desarrollos a medida

Diseño, digitalización y producción de contenidos de aprendizaje a medida. Nuestro Framework de diseño

¿Quieres más información sobre este curso?

Rellena el formulario con tus datos y nos pondremos en contacto contigo para darte todos los detalles de nuestras licencias.

¡Qué bien! Necesitamos saber algunas cosas de ti :)

Nombre *
Apellido *
Email *
Número de teléfono *
Nombre de la empresa
Web de tu empresa
Tipo de empresa *
Finalidad de tu solicitud *
País/región
Mensaje

¿Tienes alguna duda o quieres más información?

Déjanos tus datos y nos pondremos en contacto contigo para resolverte todas tus dudas.

¡Qué bien! Necesitamos saber algunas cosas de ti :)

Nombre *
Apellido *
Email *
Teléfono *
Nombre de la empresa *
País/región *
Tipo de empresa *
¿Participas en convocatorias de formación de oferta estatales o autonómicas? *
¿En qué podemos ayudarte?
Mensaje