platzi / Mlops-platzi

Materials and content for the Platzi´s course of Mlops

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

¡Hola, hola!

💚 Bienvenidos al fascinante mundo de MLOps 💚

Este repositorio del curso de MLOps: Despliegue de Modelos de Machine Learning está diseñado para guiarte en el emocionante camino hacia la maestría en MLOps. Aquí, aprenderás todo lo necesario para convertirte en un verdadero experto en el tema.

Me emociona infinitamente que seas parte de este viaje y espero que este material aporte signiticativamente a tu crecimiento profesional.

Para nuestras configuraciones utilizaremos poetry, un gestor que nos permitirá tener paquetes en ambientes de test o producción, además de la ventaja de poder trabajar con diferentes versiones de Python.

Hablando de Python, te sugiero utilizar pyenv para gestionar sus versiones, es muy sencillo de usar y te facilitará la vida. No obstante, si ya tienes tu gestor favorito, no hay problema, lo esencial es que te sientas cómodo.

En el transcurso de este curso, daremos un recorrido desde los conceptos básicos de MLOps hasta la puesta en producción de un modelo de Machine Learning. En el camino aprenderemos a usar diferentes herramientas y a configurar ambientes de desarrollo óptimos.

Este repositorio tiene dos ramas principales: master y deploy_prod. En master abordaremos los temas de tracking y orquestación; mientras que en deploy_prod encontrarás todo lo relacionado con el despliegue de un modelo de Machine Learning en producción.

🔒Importante🔒: Los datos generados son sensibles, así que guardémoslos de manera segura. Te recomiendo usar un bucket de S3 o algún otro lugar seguro. Así aseguramos que nuestros repositorios solo contengan lo necesario y mantenemos nuestras bases de datos en un lugar seguro y gestionado. Para todo lo relacionado a la nube, recuerda que tienes el archivo de configuración a tu disposición.

Te invito a que añadas todo lo que ya sabes del Machine Learning, haz modelos increíbles; no olvides hacer validación de hiperparámetros, los tests necesarios para reconocer cuando te enfrentas con underfitting u overfitting, y tomar acciones de si disminuyes dimensionalidad de tus datos, aumentas la data, haces features engineering, etc. En los temas que ya vimos, te recomiendo que pongas en práctica todo lo que aprendiste, y para hacer más profesionales tus flujos, atrévete a desarrollar workflows, agendarlos, usar artefactos como input y output entre las tasks. Y añadas toda la lógica que necesitas si requieres de triggers o notificaciones.

Si enfrentas problemas de cómputo, no olvides que puedes usar los recursos de la nube, puedes hacer paralelismo con Dask, usar un cluster de Spark, usar multiprocessing, etc. Y si necesitas más procesamiento, en tu arquitectura no olvides procesar por chunks o mejorar las estrategias de procesamiento.

Si en algún momento tienes dudas o necesitas ayuda, ¡no dudes en escribirme! Estoy aquí para ayudarte y recuerda que tus compañeros también pueden ser una gran fuente de conocimiento y apoyo. ¡Disfruta el curso y mucha suerte en tu aprendizaje!

  • Con todo cariño, Profe Cami 💙

About

Materials and content for the Platzi´s course of Mlops


Languages

Language:Jupyter Notebook 99.1%Language:Python 0.9%