Team #2
Цель проекта: разработать конвеер машинного обучения data-продукта (Web или API приложение).
Разработана модель для определения эмоциональной окраски текста (позитивный/негативный). Также разработаны:
- Простой веб-интерфейс
- Тесты на качество данных, на качество работы модели на тестовых данных и на работоспособность модели в веб-приложении.
- Пайплайн в Jenkins (Jenkinsfile)
- Версионирование данных с помощью DVC Для удобства были сделаны 2 тега в репозитории:
- В ветке main - датасет Тональность отзывов об обслуживании
- Под тегом dataset_v2 - датасет Russian-language reviews
- Под тегом dataset_merged - два объединенных датасета Во время работы пайплайна в Jenkins первым шагом он ожидает пока пользователь выберет версию датасета, которую дальше использовать:
- Сборка Docker образа в пайплайне
- Загрузка Docker образа на Dockerhub в пайплайне
Использованы наборы данных:
Студенты:
- Шершнев Андрей (РИМ-120907)
- Кожин Артём (РИМ-120906)
- Иванов Сергей (РИМ-120906)
- Чупахин Юрий (РИМ-120908)