bettachini / EEA-2023

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

EEA-UBA 2023

Ayudantes

Juan Manuel Barriola

Franco Mastelli

Fernando Gonzalez

Clase 1: Fundamentos de programación en R

Presentación / Encuesta inicio de curso

Fundamentos de programación en R: entorno, objectos, estructuras de datos, loops, control flow y funciones

  • [Introducción al entorno R](clase 1/Clase 1 - Introduccion a R.nb.html)
  • [Loops, condicionales y funciones](clase 1/Clase 1 - Loops, condicionales y funciones.nb.html)
  • [Ejercicios](clase 1/Clase 1 - Ejercicios -Consignas .nb.html)
  • [Resueltos](clase 1/Resueltos/Clase 1 - Ejercicios -Resueltos.R)

Datasets para ejercicios

Clase 2: Tidyverse

Introducción al paquete Tidyverse: trabajo con datasets (dplyr y tidyr), fechas (lubridate), strings (stringr) y gráficos (ggplot2)

  • [Tidyverse](clase 2/Clase 2 - Tidyverse.nb.html )
  • [Ejercicios](clase 2/Clase 2 - Ejercicios.nb.html )
  • [Resueltos](clase 2/resueltos)

Datasets para ejercicios

Material opcional

  • [Gráficos de kernels y tendencias](clase 2/Clase 2 - Kernels y Tendencias (OPCIONAL).nb.html)
  • [Distintos tipos de Join](clase 2/Clase 2. Distintos tipos de Join (OPCIONAL).nb.html)

Clase 3: Correlación y Regresión Lineal Simple I

Estimación y test de correlación entre 2 variables. Matrices de correlación: librerías corrr y GGally

  • [Correlación](clase 3/Clase-3---Correlacion.html)

Análisis exploratorios, limpieza de datos, análisis de outliers e interpretación de los coeficientes de un modelo lineal simple

  • [Regresión Lineal Simple: Modelo e interpretación](clase 3/Clase-3---Regresion-Lineal-Simple.html)

Dataset Notebook Modelo Lineal

Clase 4: Regresión Lineal Simple II y PURRR

Inferencia sobre los parámetros, test de significatividad global y R-cuadrado

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Introducción a programación funcional con Tidyverse PURRR

  • [Tidyverse:PURRR](clase 4/PURRR.nb.html)

Clase 5: Diagnóstico de Regresión Lineal

Diagnóstico de modelo lineal simple

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Modelo lineal desde el enfoque de Machine Learning: random search y grid search de parámetros, función objetivo y métodos de optimización para hallar los valores de los parámetros

  • [Regresión Lineal Simple: Enfoque de Machine Learning](clase 5/modelo_lineal_enfoque_ml_resuelto.nb.html)

Un ejemplo de Shiny App sobre Overfitting (basado en https://github.com/apapiu/Shiny-Apps)

  • [Shiny App](clase 5/shiny/overfitting/app.R)

Clase 6: Regresión Lineal Múltiple I

Interpretación de coeficientes en Regresión Lineal Múltiple, inclusión de variables categóricas y test de significatividad individual

  • [Regresión Lineal Múltiple: Parte I](clase 6/Clase 6 - Regresion Lineal Multiple.nb.html)

Dataset Notebook Modelo Lineal Múltiple

Clase 7: Regresión Lineal Múltiple II

Evaluación y diagnóstico del modelo. Explicación vs predicción.

  • [Regresión Lineal Múltiple: Parte II](clase 7/Clase 7 - Regresion Multiple II.nb.html)

Dataset Preprocesado Modelo Lineal Múltiple

  • [Datos Properati Preprocesados](clase 6/properati_preprocesado_2022.csv)

Clase 8: Extensiones de Regresión Lineal

Extensiones del Modelo de Regresión Lineal Múltiple.

  • [Extensiones Modelo Lineal Múltiple](clase 8/Clase 8 - Molelo log(price).nb.html)

Clase 9: Regresión Bayesiana

Regresión Bayesiana

  • [Regresión Bayesiana](clase 9 bis/clase_9_regresion_bayesiana.html)

Construcción datasets NBA

  • [Notebook creación de datasets NBA](clase 10/creacion_datasets_nba.html)

Clase 10: Regresión Logística

Regresión Logística: modelo de clasificación. Interpretación de coeficientes, métricas y gráficos de evaluación del modelo y evaluación de performance.

Problema del desbalanceo de clases: comportamiento del modelo, estrategia de oversampling y su efecto en el modelo

  • [Regresion Logistica](clase 9/logit.nb.html)

Clase 11: Regularización

Regularización: modelos Ridge, Lasso y Elastic Net y trade off sesgo-varianza

  • [Regularizacion: Ridge, Lasso y Elastic Net](clase 10/regularizacion.html)

Datasets para técnicas de regularización

Clase 12: Modelos Aditivos Generalizados: Prophet

Smoothing, GAM y Prophet.

  • [Prophet: implementacion de GAM para series de tiempo](clase 11/prophet_shopping.nb.html)

Clase 14: Redes Neuronales I

Redes Neuronales

  • [Introducción a Redes Neuronales](clase 12/redes_fully_connected.nb.html)

  • [Introducción a tidymodels](clase 11/tidymodels.nb.html)

About

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

License:MIT License


Languages

Language:HTML 99.9%Language:Jupyter Notebook 0.0%Language:TeX 0.0%Language:R 0.0%Language:Stan 0.0%