jorgeanais / mly0100_machinelearning

Apuntes del curso de Machine Learning

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

MLY0100-002V Machine Learning

Profesor Jorge Anais
Semestre primavera 2023

Este repositorio contiene los apuntes del curso de Machine Learning

Resultados de aprendizaje

RA1 Aplica Machine Learning en problemáticas reales en contraste con otras soluciones tradicionales, siguiendo una metodología de trabajo, estandarizada de la industria.

RA2. Realiza análisis exploratorio y preparación de datos, de acuerdo a las características del dataset y del contexto del negocio.

RA3 Elabora modelos predictivos de clasificación, mediante el lenguaje de programación Python según la información del caso.

RA4 Aplica técnicas de evaluación de modelos de Machine Learning de clasificación, de acuerdo al tipo de aprendizaje de máquinas supervisado y las buenas prácticas de la industria.

RA5 Elabora algoritmos para aprendizaje no supervisado y genera las diferentes métricas para su evaluación, de acuerdo a la resolución del problema.

Evaluaciones

Parcial 1 40% Levantamiento de un proyecto de Machine Learning

Parcial 2 30% Desarrollo de un modelo de Machine Learning Supervisado

Parcial 3 30% Desarrollo de un modelo de Machine Learning no supervisado

Exámen transversal 40% Entrega de encargo con presentación

Bibliografía

BIBLIOGRAFÍA OBLIGATORIA
- Géron, A. (2019). Aprende Machine Learning con Sci-Learn, Keras y TensorFlow (2nd ed.). O’Reilly Media.
- Raschka, Sebastian (2019). Python Machine Learning (Third Edition). Packt.
- Deisenroth M, Faisal A, Ong C.(2020). Mathematics for Machine Learning. Published by Cambridge University Press. https://mml-book.github.io/
- Battiti R, Brunato M. (2017). The LION way: Machine Learning plus Intelligent Optimization. LIONlab, University of Trento, Italy. https://intelligent-optimization.org/LIONbook/
- Valenzuela, N. J. S. (2018). Python Aplicaciones prácticas. RA-MA.

Contenido del curso

EA 1 Introducción a Machine Learning

Indicadores de logros

RESULTADO DE APRENDIZAJE INDICADORES DE LOGRO
RA1 Aplica Machine Learning en problemáticas reales en contraste con otras soluciones tradicionales, siguiendo una metodología de trabajo, estandarizada en la industria. IL 1.1 Reconoce metodologías orientadas a datos como CRISP-DM para el desarrollo de los proyectos de ML.

IL 1.2 Reconoce las diferencias entre un modelo supervisado y uno no supervisado según el contexto del caso y la naturaleza de los datos.

IL 1.3 Reconoce las librerías de lenguaje python para desarrollar las diferentes tareas en un proyecto de aprendizaje automático.

IL 1.4 Aplica algoritmos de regresión para construir modelos supervisados según los requerimientos del caso.

IL 1.5 Utiliza métricas de evaluación de modelos de regresión, considerando aprendizaje de máquinas supervisado, según las buenas prácticas de la industria.
RA2 Realiza análisis exploratorio y preparación de datos, de acuerdo a las características del dataset y del contexto del negocio. IL 2.1 Realiza limpieza y preparación de datos de acuerdo con las buenas prácticas de la industria, utilizando lenguaje Python sobre Jupyter notebook.

IL 2.2 Elabora documentación del proceso comparando los resultados obtenidos a partir de la información del caso y de los datos.

IL 2.3 Realiza limpieza y preparación de los datos considerando missing values, outliers, normalización y estandarización según los requerimientos.

IL 2.4 Aplica elementos de estadística descriptiva para realizar análisis exploratorio complementando el significado y distribución de los datos.

IL 2.5 Asocia los resultados obtenidos en el análisis exploratorio con el entendimiento del negocio para dar respuesta a los requerimientos de cada caso.

Evaluaciones

Formativa 1 Actividad práctica Autoevaluación 0%
Parcial 1: Levantamiento de un proyecto de Machine Learning 1. Prueba de conocimientos
2. Entrega de encargo
Docente 40%

EA2 Modelos supervisados: Regresión y Clasificación

Indicadores de logros

RESULTADO DE APRENDIZAJE INDICADORES DE LOGRO
RA3 Elabora modelos predictivos de clasificación, mediante el lenguaje de programación Python según la información del caso. IL 3.1 Reconoce las diferencias en una tarea de clasificación de una regresión en el aprendizaje supervisado, con el objetivo de dar respuesta a una problemática orientada al uso de datos.

IL 3.2 Utiliza técnicas para analizar la correlación entre los diferentes features a usar en un modelo de Machine Learning.

IL 3.3 Realiza ingeniería de características, seleccionando y transformando los atributos para desarrollar un buen modelo de clasificación.

IL 3.4 Construye modelos de clasificación en aprendizaje supervisado, utilizando lenguaje Python sobre Jupyter notebook. 

IL 3.5 Identifica problemáticas asociadas al entrenamiento de los datos como overfitting y underfitting.
RA4 Aplica técnicas de evaluación de modelos de Machine Learning de clasificación, de acuerdo al tipo de aprendizaje de máquinas supervisado y las buenas prácticas de la industria. IL 4.1 Identifica métricas de evaluación de modelos de clasificación, considerando aprendizaje de máquinas supervisado, según las buenas prácticas de la industria.

IL 4.2 Utiliza las métricas que derivan de una matriz de confusión para validar y discriminar el mejor modelo de clasificación.

IL 4.3 Aplica técnicas de balance de clases para mejorar la generalización en el desempeño de los modelos de clasificación.

IL 4.4 Analiza las métricas de los modelos de clasificación desarrollados, justificando el más adecuado dependiendo del caso.

IL 4.5 Identifica las ventajas y desventajas de cada métrica en la evaluación de los modelos de clasificación.

Evaluaciones

Formativa 2 Quiz Autoevaluación 0%
Parcial 2: Desarrollo de un modelo de Machine Learning Supervisado Entrega de encargo Docente 30%

EA4 Modelos no supervisados

Indicadores de logros

RESULTADO DE APRENDIZAJE INDICADORES DE LOGRO
RA5 Elabora algoritmos para aprendizaje no supervisado y genera las diferentes métricas para su evaluación, de acuerdo a la resolución del problema. IL 5.1 Identifica los diferentes casos de uso donde se aplica aprendizaje no supervisado, reconociendo sus ventajas y desventajas.

IL 5.2 Construye modelos de aprendizaje no supervisado utilizando algoritmos de segmentación según corresponda.

IL 5.3 Utiliza técnicas que ayuden a seleccionar la cantidad óptima de clusters en los modelos de segmentación para aprendizaje no supervisado.

IL 5.4 Programa en lenguaje Python sobre Jupyter notebook, modelos de segmentación para aprendizaje no supervisado.

IL 5.5 Reconoce métricas de rendimiento para modelos no supervisados que permitan validar los resultados obtenidos.

Actividades

  1. EA1
    1. Introducción a machine learning
    2. Metodologías Orientadas a Datos: CRISP-DM
    3. Conceptos de algebra lineal y su uso en Machine Learning
    4. Estadística descriptiva para Machine Learning
    5. Estrategias para tratamiento de Missing Values y Outliers
    6. Escalamiento y Encoding
    7. Tareas de regresión para modelos predictivos y sus métricas
  2. EA2
    1. Regresión logística
    2. Clasificación Binaria
    3. Clasificación Multiclase
    4. Métricas de clasificación
    5. Entrenamiento, prueba y validación. Cross validation.
  3. EA3
    1. Introducción al aprendizaje No supervisado
    2. Clustering. Generalidades
    3. K-means, K-medoids
    4. Clustering jerárquico
    5. Density based clustering y agrupamiento Gaussiano
    6. Reducción dimensional

About

Apuntes del curso de Machine Learning


Languages

Language:Jupyter Notebook 100.0%