karbartolome / 2023_modulo_3

M3 - Introducción al modelado de datos

Home Page:https://dcscyhd.github.io/2023_modulo_3/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Docentes: Carolina Pradier y Guido Weksler.

Materiales de cursada

Los materiales para la cursada se encuentran estructurados por clases. En esta página encontrarán para cada clase un botón de descarga de los contenidos.

Programa

Contenidos

Clase 1 - Introducción: tipos de modelos, trade-offs:

En el archivo 0_packages pueden encontrar el código para descargar los paquetes que vamos usar en el módulo.

  • Temas de clase:
    • ¿Por qué construir modelos?
    • Predicción vs inferencia
    • Regresión vs clasificación
    • Paramétricos vs no paramétricos
    • Supervisado vs no supervisado
    • Trade-off precisión-interpretabilidad
    • Trade-off sesgo-varianza
    • Evaluación. Nociones de train/test, validation, matriz de confusión
    • Flujo de trabajo: explorar, transformar, modelizar, evaluar
    • Introducción a Tidymodels

Clase 2 - Explorando y transformando variables. Intro a regresión lineal simple:

  • Temas de clase:
    • ¿Qué tipo de modelo es la regresión lineal?
    • ¿Qué preguntas responde la regresión lineal?
    • Tipos de relaciones entre variables
    • Regresión lineal simple: fórmula, coeficientes y mínimos cuadrados
    • Tests de hipótesis e intervalo de confianza. P-valor
    • Predicciones
    • Supuestos del modelo. Residuos y su distribución
    • Métricas de evaluación de un modelo: R2
    • Tidymodels 1

Clase 3 - Regresión lineal simple y múltiple:

  • Temas de clase:
    • Regresión múltiple: ¿por qué no una simple por cada variable?
    • Fórmula, coeficientes e interpretación
    • Variables independientes cualitativas y términos de interacción
    • Tests de hipótesis 2: significatividad global
    • Multicolinealidad. El trade-off sesgo-varianza
    • Complejizamos la métrica de evaluación del modelo: R2 ajustado
    • Tidymodels 2

Clase 4 - Clasificación 1: Regresión logística:

  • Temas de clase:
    • Modelos de clasificación: para qué sirven y cuáles existen
    • Los limites de la regresión lineal.
    • ¿Qué tipo de modelo es la regresión Logística?
    • Coeficientes y lectura de outputs
    • Train-Test split
    • Medidas de evaluación del modelo

Clase 5 - Clasificación 2: Intro a KNN y LDA:

  • Temas de clase:
    • Limites de la regresión logística.
    • Clasificador de Bayes.
    • K-Nearest Neighbors supervisado
    • LDA

Clase 6 - Cross-Validation y repaso general:

  • Temas de clase:
    • Limitantes del enfoque Train-Test
    • Cross-Validation.
    • Repaso de clases 1 a 5

About

M3 - Introducción al modelado de datos

https://dcscyhd.github.io/2023_modulo_3/


Languages

Language:HTML 99.9%Language:R 0.1%