IFCT0172

Arquitectura big data

Conocer los diferentes paradigmas de procesamiento en sistemas BigData y dominar las principales tecnologías y su utilización para el diseño de arquitecturas escalables adaptadas a cada proyecto.

Diseñado y producido por Smartmind

Disponibilidad:

Procesamiento y cierre

Contenidos

IFCT0172 — Arquitectura big data

Módulo 1

Procesamiento de datos

Objetivo. Utilizar herramientas y técnicas para procesar grandes volúmenes de datos, tanto en modo batch como en streaming, utilizando ecosistemas distribuidos como Hadoop, Spark y Amazon EMR, maximizando la eficiencia en el análisis y transformación de datos. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 3

Conocimiento/capacidades cognitivas y prácticas

Conocimiento de Batch Processing

Hadoop: Ecosistema, HDFS y MapReduce.

Pig: Procesamiento de datos con scripting.

Hive: SQL sobre Hadoop, creación de tablas y consultas.

Sqoop: Transferencia de datos entre sistemas relacionales y Hadoop.

Flume: Ingesta de datos no estructurados hacia HDFS

Spark Core y Spark 2.0: Procesamiento distribuido y nuevas funcionalidades.

Conocimiento de Streaming Processing

Fundamentos de Streaming: Procesamiento continuo de datos.

Spark Streaming: Procesamiento en tiempo real con Spark.

Kafka: Mensajería y procesamiento de eventos.

Pulsar y Apache Apex: Alternativas avanzadas para flujos.

Implementación práctica de sistemas real-time: Diseño e implementación.

Aplicación de medidas de eficiencia energética y sostenibilidad ambiental.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Capacidad de orientación al cliente y escucha en la toma de requisitos.

Comunicación efectiva de los diseños e implementaciones realizados.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Módulo 2

Almacenamiento y bases de datos

Objetivo. Diseñar, implementar y gestionar sistemas de almacenamiento distribuidos y bases de datos NoSQL. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 1

Conocimiento/capacidades cognitivas y prácticas

Uso de sistemas NoSQL

HBase: Almacenamiento basado en columnas.

Cassandra: Escalabilidad y alta disponibilidad.

MongoDB: Base de datos orientada a documentos.

Neo4J: Modelado de datos en gráficos.

Redis: Almacenamiento clave-valor en memoria.

Berkeley DB: Base de datos embebida.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Capacidad para gestionar proyectos de recopilación de datos .

Preocupación por el seguimiento y cumplimiento de políticas y regulaciones de seguridad.

Preocupación por el seguimiento y cumplimiento de políticas de protección de datos.

Módulo 3

Computación híbrida y Cloud Computing

Objetivo. Implementar arquitecturas híbridas (batch y streaming) y optimizar entornos en la nube utilizando plataformas como AWS y GCP. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 2

Conocimiento/capacidades cognitivas y prácticas

Manejo de sistemas de Computación Híbridos

Arquitectura Lambda: Procesamiento híbrido batch y streaming.

Arquitectura Kappa: Enfoque simplificado para streaming.

Apache Flink: Procesamiento de flujos y batch.

Druid: Analíticas OLAP rápidas.

ElasticSearch y Logstash: Ingesta, búsqueda y analítica.

Kibana: Visualización de datos en tiempo real.

Aplicación de Cloud Computing

Amazon Web Services (AWS): Uso de EMR, S3 y Redshift.

Google Cloud Platform (GCP): BigQuery y DataFlow para análisis.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Capacidad para gestionar proyectos de recopilación de datos .

Preocupación por el seguimiento y cumplimiento de políticas y regulaciones de seguridad.

Preocupación por el seguimiento y cumplimiento de políticas de protección de datos.

Módulo 4

Administración y visualización de datos

Objetivo. Administrar clústeres Big Data, optimizando su rendimiento, seguridad y monitoreo y, utilizar de herramientas de visualización avanzadas como Tableau, Kibana y D3 para transformar los datos en insights visuales útiles para la toma de decisiones empresariales. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 2

Conocimiento/capacidades cognitivas y prácticas

Administración de Sistemas Big Data

Instalación y Administración de Clusters: Cloudera y Hortonworks.

Optimización y Monitorización: Métricas y eficiencia.

Seguridad: Apache Knox, Ranger y Sentry.

Visualización de Datos

Herramientas como Tableau y CartoDB: Dashboards y mapas.

Librerías avanzadas: D3, Leaflet y Cytoscape.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Adaptación a las necesidades y políticas empresariales.

Preocupación por el seguimiento y cumplimiento de políticas de protección de datos.

Preocupación por el seguimiento y cumplimiento de políticas y regulaciones de seguridad.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).