Profesionales con experiencia que se desarrollan en áreas de Inteligencia de Negocios, TI, Data, Marketing, Planeamiento, Analytics u otras áreas relacionadas con el análisis de datos en el sector público y/o privado.
Dirigido a profesionales y/o estudiantes de últimos ciclos sin experiencia en el desarrollo e implementación de proyectos de análisis de datos con enfoque en el negocio.
Sesión 1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
– La era de los datos, evolución del valor de los datos.
– Tipos de análisis de datos.
– ¿Que es Data Science? Aplicaciones y conceptos principales.
– Definición de la variable de estudio o target.
– Fases de un proyecto analítico.
– Herramientas y tecnologías más utilizadas.
Sesión 2
FUNDAMENTOS DE PROGRAMACIÓN CON PYTHON
– Definición y manejo de variables.
– Uso y manejo del ambiente Python en Google Colab.
– Funciones y estructuras iterativas.
– Manipulación de datos con Pandas.
– Caso práctico.
Sesión 3
ESTADÍSTICA PARA ANÁLISIS DE DATOS
– Origen, definición y ramas de la estadística.
– Tipos de datos (Cualitativos y cuantitativos).
– Medidas de tendencia de posición (tendencia central y no central) y dispersión.
– Diagrama de Cajas, Correlación y Covarianza.
– Gráficos estadísticos para variables cuantitativas y cualitativas.
– Caso práctico.
Sesión 4
ANÁLISIS EXPLORATORIO Y VISUALIZACIÓN DE DATOS
– Definición y objetivos del análisis exploratorio.
– Relaciones entre variables. Detección de outliers.
– Manejo de datos. Análisis de valores atípicos. Detección de patrones.
– Visualización de datos con Matplotlib y Seaborn.
– Caso práctico.
Sesión 5
PREPARACIÓN Y TRANSFORMACIÓN DE DATOS
– Manejo y limpieza de datos.
– Técnicas de tratamiento mediante funciones lineales y no lineales.
– Generación de nuevas variables adecuadas al negocio.
– Imputación de datos mediante técnicas univariados y multivariadas.
– Caso práctico.
Sesión 6
BALANCEO DE DATOS Y ALGORITMOS NO SUPERVISADOS
– Definición e Importancia.
– Agrupación y Reducción de Dimensiones.
– Muestreo. Partición train-test-validación.
– Técnicas estadísticas: K Means, DB Scan, PCA.
– Técnicas de balanceo de datos: Undersampling, Oversampling, SMOTE
Sesión 7
MACHINE LEARNING: ALGORITMOS SUPERVISADOS
– Entendiendo los métodos supervisados.
– Algoritmos de Clasificación: Árbol de decisión, Regresión Logística, Random Forest, SVM, XGBoost, Light GBM.
– Algoritmos de Regresión: Regresión Lineal y Múltiple, Random Forest, SVM, Rige, Lasso.
– Comparación entre modelos .
Sesión 8
EVALUACIÓN E IMPLEMENTACIÓN DE MODELOS ANALITICOS
– Técnicas de validación de modelo.
– Matriz de confusión, Accuracy, Precisión, Recall, F1 Score.
– Búsqueda de recomendaciones óptimas para la toma de decisiones.
– KPI’s de Negocio.
– Implementación de Modelos Analíticos.
– Taller de presentaciones efectivas.