Profesionales con experiencia que se desarrollan en áreas de Inteligencia de Negocios, TI, Data, Marketing, Planeamiento, Analytics u otras áreas relacionadas con el análisis de datos en el sector público y/o privado.
Dirigido a profesionales y/o estudiantes de últimos ciclos sin experiencia en el desarrollo e implementación de proyectos de análisis de datos con enfoque en el negocio.
MÓDULO 1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
- La era de los datos, evolución del valor de los datos.
- Tipos de análisis de datos.
- ¿Que es Data Science? Aplicaciones y conceptos principales.
- Definición de la variable de estudio o target.
- Fases de un proyecto analítico.
- Herramientas y tecnologías más utilizadas.
MÓDULO 2
FUNDAMENTOS DE PROGRAMACIÓN CON PYTHON
- Definición y manejo de variables.
- Uso y manejo del ambiente Python en Google Colab.
- Funciones y estructuras iterativas.
- Manipulación de datos con Pandas.
- Caso práctico.
MÓDULO 3
ESTADÍSTICA PARA ANÁLISIS DE DATOS
- Origen, definición y ramas de la estadística.
- Tipos de datos (Cualitativos y cuantitativos).
- Medidas de tendencia de posición (tendencia central y no central) y dispersión.
- Diagrama de Cajas, Correlación y Covarianza.
- Gráficos estadísticos para variables cuantitativas y cualitativas.
- Caso práctico.
MÓDULO 4
ANÁLISIS EXPLORATORIO Y VISUALIZACIÓN DE DATOS
- Definición y objetivos del análisis exploratorio.
- Relaciones entre variables. Detección de outliers.
- Manejo de datos. Análisis de valores atípicos. Detección de patrones.
- Visualización de datos con Matplotlib y Seaborn.
- Caso práctico.
MÓDULO 5
PREPARACIÓN Y TRANSFORMACIÓN DE DATOS
- Manejo y limpieza de datos.
- Técnicas de tratamiento mediante funciones lineales y no lineales.
- Generación de nuevas variables adecuadas al negocio.
- Imputación de datos mediante técnicas univariados y multivariadas.
- Caso práctico.
MÓDULO 6
BALANCEO DE DATOS Y ALGORITMOS NO SUPERVISADOS
- Definición e Importancia.
- Agrupación y Reducción de Dimensiones.
- Muestreo. Partición train-test-validación.
- Técnicas estadísticas: K Means, DB Scan, PCA.
- Técnicas de balanceo de datos: Undersampling, Oversampling, SMOTE
MÓDULO 7
MACHINE LEARNING: ALGORITMOS SUPERVISADOS
- Entendiendo los métodos supervisados.
- Algoritmos de Clasificación: Árbol de decisión, Regresión Logística,Random Forest, SVM, XGBoost, Light GBM.
- Algoritmos de Regresión: Regresión Lineal y Múltiple, Random
- Forest, SVM, Rige, Lasso.
- Comparación entre modelos .
MÓDULO 8
EVALUACIÓN E IMPLEMENTACIÓN DE MODELOS ANALITICOS
- Técnicas de validación de modelo.
- Matriz de confusión, Accuracy, Precisión, Recall, F1 Score.
- Búsqueda de recomendaciones óptimas para la toma de decisiones.
- KPI’s de Negocio.
- Implementación de Modelos Analíticos.
- Taller de presentaciones efectivas.