IFCT0136

Minería de datos y big data para ingeniería

Aplicar técnicas avanzadas de minería de datos y algoritmos de Big Data mediante R, Hadoop y WEKA, abordando desde el análisis y modelado predictivo hasta el procesamiento distribuido, para resolver problemas de ingeniería y apoyar la toma de decisiones basada en datos.

Diseñado y producido por Smartmind

Disponibilidad:

Consultar

Contenidos

IFCT0136 — Minería de datos y big data para ingeniería

Módulo 1

Introducción a la Minería de Datos y Aprendizaje Automático

Objetivo. Conocer los conceptos fundamentales de la minería de datos y el aprendizaje automático, sus áreas de aplicación y técnicas principales y los principales elmentos para mejorar la eficiencia energética en el trabajo con grandes volúmenes de datos. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 6

Conocimiento/capacidades cognitivas y prácticas

Conocimiento de los conceptos básicos de minería de datos y aprendizaje automático

Aplicación del proceso de descubrimiento de conocimiento en bases de datos (KDD)

Aplicación de modelos y técnicas de Data Mining

Uso de minería de textos y web mining

Identificación de aplicaciones prácticas

Identificación de procedimientos de eficiencia energética en el trabajo con grandes volúmenes de datos

Optimización del consumo energético mediante la gestión eficiente de recursos.

Gestión eficiente del almacenamiento para reducir el desperdicio de espacio.

Uso de herramientas de monitorización para identificar y reducir el consumo innecesario de recursos.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Adaptación constante al cambio, comprendiendo la importancia de mantenerse actualizado con las últimas tendencias y tecnologías en la automatización de entornos TIC.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Módulo 2

Análisis y Visualización de Datos

Objetivo. Aprender a utilizar R y RStudio como herramientas para análisis de Big Data, visualización y manipulación de datos. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 1

Conocimiento/capacidades cognitivas y prácticas

Utilización de R y RStudio

Instalación y configuración de R y RStudio.

Fundamentos del lenguaje R.

Estructuras de datos en R (vectores, listas, matrices y data frames).

Control de flujo y funciones en R.

Visualización de datos en gráficos básicos con ggplot2.

Introducción a expresiones regulares.

Integración de R con Hadoop y casos de uso en Big Data.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Capacidad de análisis en el uso de herramientas como R y RStudio para interpretar y manipular grandes volúmenes de información.

Preocupación por el seguimiento y cumplimiento de políticas y regulaciones de seguridad.

Cumplimiento de normas éticas y legales.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Módulo 3

Modelado Predictivo y Análisis de Redes

Objetivo. Desarrollar habilidades en técnicas de preprocesamiento, modelado predictivo y análisis de redes sociales, con un enfoque práctico en la toma de decisiones. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 2

Conocimiento/capacidades cognitivas y prácticas

Preprocesamiento y Modelado Predictivo

Extracción, transformación y carga de datos (ETL)

Inferencia estadística y pruebas de hipótesis

Modelos de regresión y clasificación

Árboles de decisión (C4.5, M5P, etc.) y Random Forest

Algoritmos de clustering y k-NN

Evaluación de rendimiento de modelos predictivos

Análisis de Redes y Presentación de Resultados

Introducción a la teoría de grafos y redes sociales

Métricas y análisis de redes sociales

Técnicas de visualización de redes

Presentación de resultados para toma de decisiones.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Enfoque analítico y habilidades para tomar decisiones basadas en datos.

Automatización de tareas e incremento de la eficiencia.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Módulo 4

Procesamiento Distribuido y Minería de Datos

Objetivo. Comprender los fundamentos de procesamiento distribuido utilizando Hadoop y MapReduce, así como a usar herramientas de minería de datos como WEKA para experimentar con algoritmos y modelos predictivos en un entorno visual. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 2

Conocimiento/capacidades cognitivas y prácticas

Procesamiento Distribuido de Datos

Introducción a Hadoop y el sistema de archivos HDFS

Conceptos básicos de configuración de clusters

Procesamiento de datos con MapReduce

Buenas prácticas para la administración de datos distribuidos

Ejecución de trabajos MapReduce en entornos distribuidos

Aplicación de minería de Datos

Introducción a WEKA y técnicas de data mining aplicadas

Selección de atributos y preparación de datos

Ejecución de algoritmos de clasificación y clustering

Evaluación de modelos y análisis de resultados.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Enfoque analítico y habilidades para tomar decisiones basadas en datos.

Automatización de tareas e incremento de la eficiencia.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Fomento del trabajo colaborativo y de la gestión de tareas dentro de entornos distribuidos.