IFCT0182

Data mining: principios y aplicaciones

Construir y desarrollar bases de datos orientadas a la toma de decisiones y a la extracción de conocimiento.

Diseñado y producido por Smartmind

Disponibilidad:

Consultar

Contenidos

IFCT0182 — Data mining: principios y aplicaciones

Módulo 1

Fundamentos y Preparación de Datos

Objetivo. Adquirir los conocimientos y habilidades necesarios para construir y desarrollar bases de datos orientadas a la toma de decisiones. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 4

Conocimiento/capacidades cognitivas y prácticas

Comprensión de la Minería de Datos

Conceptos básicos o Definición y objetivos del Data Mining. o Diferencia entre minería de datos, análisis de datos y machine learning. o Ciclo de vida del proceso KDD (Descubrimiento de Conocimiento en Bases de Datos).

Fundamentos teóricos o Introducción a técnicas de clasificación, clustering y asociación. o Fundamentos matemáticos: probabilidad, álgebra lineal y estadísticas básicas.

Manejo y Manipulación de Datos

Bases de datos o Fundamentos de bases de datos relacionales. o Introducción a SQL para extracción y manipulación de datos. o Conexión con bases de datos no relacionales (NoSQL).

Preprocesamiento y limpieza de datos o Identificación y tratamiento de valores faltantes y atípicos. o Normalización y escalado de datos. o Reducción de dimensionalidad (PCA y selección de características).

Uso de herramientas de análisis de datos

Introducción a las herramientas o Python y R: comparación y uso para Data Mining. o Hadoop y Spark: procesamiento en grandes volúmenes de datos.

Implementación práctica o Configuración de entornos y uso de bibliotecas clave (pandas, scikit-learn, tidyverse, etc.). o Lectura, manipulación y visualización básica de datos.

Búsqueda de la eficiencia energética y desarrollo sostenible:

En el desarrollo de software y diseño.

En la selección de proveedores y servidores.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Trabajo en equipo para desarrollar la capacidad de colaborar en proyectos de análisis de datos en equipos interdisciplinarios.

Gestión de proyectos para planificar, organizar y ejecutar proyectos de minería de datos, asegurando el cumplimiento de plazos y la calidad de los resultados.

Adaptabilidad tecnológica, fomentando una actitud positiva hacia el uso de nuevas tecnologías y la actualización constante en técnicas de análisis de datos y software especializado.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Módulo 2

Modelado, Evaluación y Aplicaciones Avanzadas

Objetivo. Adquirir los conocimientos y habilidades necesarios para extraer conocimiento de datos preparados. CONOCIMIENTOS/ CAPACIDADES COGNITIVAS Y PRÁCTICAS

Contenidos: 2

Conocimiento/capacidades cognitivas y prácticas

Desarrollo y Evaluación de Modelos

Modelos predictivos o Construcción de modelos de regresión y clasificación. o Evaluación y optimización de modelos: métricas (precisión, recall, AUC, etc.). o Validación cruzada y ajuste de hiperparámetros.

Técnicas avanzadas o Algoritmos de clustering: k-means, DBSCAN, jerárquicos. o Análisis de reglas de asociación: Apriori y FP-Growth.

Evaluación e interpretación o Interpretación de resultados de modelos. o Métodos para mejorar la precisión y robustez de los modelos.

Identificación de las aplicaciones prácticas

Minería de datos en sectores clave o Aplicaciones en marketing, salud, finanzas, e-commerce, etc. o Casos reales de uso y análisis de impacto.

Proyecto práctico o Implementación de un pipeline completo de minería de datos desde la preparación hasta el modelo final. o Documentación y presentación de resultados.

HABILIDADES DE GESTIÓN, PERSONALES Y SOCIALES

Coordinación en actividades prácticas de trabajo colaborativo para resolver problemas simples de análisis de datos.

Fomento de la capacidad analítica.

Trabajo buscando la eficiencia energética (reducción del uso de memoria volátil y persistente, uso de entornos de desarrollo con impacto reducido en el consumo de recursos, etc.).

Comunicación de resultados para presentar de manera clara y efectiva los resultados del análisis de datos, tanto en informes técnicos como en presentaciones orales.