Carlos Isaac Zainea Maya
En el curso se construyen los fundamentos teóricos de los principales métodos de la estadística exploratoria multidimensional y se trabajan sus aplicaciones, utilizando software especializado de uso libre y comercial. Las prácticas se orientan a la aplicación de los métodos a situaciones reales que requieren apropiación de los contextos específicos, a partir de la revisión de artículos, para realizar interpretaciones adecuadas de los datos y del fenómeno en general. Para el aprendizaje de la aplicación de los métodos, el estudiante implementará los métodos usando los lenguajes Python y R.
- Aprendizaje no supervisado y sus aplicaciones Comprender los conceptos de aprendizaje no supervisado, los tipos de aprendizaje no supervisado y los retos que existen.
- Análisis de componentes principales Comprender el uso de componentes principales en situaciones de múltiples variables cuantitativas. Analiza la selección y uso de ACP.
- Análisis de componentes principales Primer avance. Problema, justificación y objetivos. Comprender el uso de componentes principales en situaciones de múltiples variables cuantitativas. Analiza la selección y uso de ACP.
- Análisis Factorial Utilizar el análisis factorial en situaciones de reducción de dimensionalidad. Realizar las fases exploratorias y confirmatorias de este tipo de análisis.
- Análisis de correspondencias múltiples Comprender las técnicas de visualización y correlación en variables categóricas. Aplicar la distancia Ji-cuadrado para analizar similitudes.
- Agrupamiento. Agrupamiento Jerarquico Segundo avance. Marco teórico – Previa metodología- Estudiar el agrupamiento de individuos a través de múltiples atributos. Entender el agrupamiento por medio de métodos jerárquicos.
- Agrupamiento de K-medias Analizar el uso de agrupamiento de K-medias. Combinar el uso de métodos jerárquicos y de k-medias.
- Otros agrupamientos Comprender el uso de agrupamientos basados en funciones de densidad.
- Aprendizaje supervisado. Clasificación y regresión Comprender el uso de regresión para la predicción de eventos. Analizar la clasificación como método de discriminación de individuos.
- Clasificación y regresión Tercer avance – Metodología y primeros resultados. Entender la función de decisión, Pronosticar probabilidades y manejar incertidumbre de clasificación.
- Estimaciones de incertidumbre de clasificadores Usar árboles de decisión para clasificar y predecir comportamientos de individuos.
- Árboles de decisión Comprender el funcionamiento de clasificadores bayesianos “ingenuos” y su aplicación en predicción de eventos.
- Clasificadores de Naive Bayes Analizar el uso de máquinas de soporte vectorial para la clasificación y regresión con alta dimensionalidad.
- Máquinas de soporte vectorial
- Exposiciones Entrega Final Diagnosticar la efectividad de la clasificación de los métodos anteriores en problemas de data mining.
Manipulación de datos en Python
Bibliografía:
Müller, A. C., & Guido, S. (2016). Introduction to machine learning with Python: a guide for data scientists. " O'Reilly Media, Inc.".
Sarkar, D., Bali, R., & Sharma, T. (2018). Practical Machine Learning with Python. A Problem-Solver's Guide to Building Real-World Intelligent Systems, New York: Springer-Verlag
Nina Zumel, John Mount, “Practical Data Science with R”, Manning Publications, 2014
Everitt, B. S. and Hothorn, T. (2011), An Introduction to Applied Multivariate Analysis with R , New York: Springer-Verlag
Kassambara, A. (2017). Practical Guide to Cluster Analysis in R: Unsupervised Machine Learning (Vol. 1). STHDA.
Jiawei Han and Micheline Kamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann Publishers, 3rd ed, 2010.