Данные проекты были выполнены в рамках курса в Яндекс.Практикуме, по профессии "Специалист по Data Science".
Название проекта | Описание проекта | Используемые библиотеки |
---|---|---|
Исследование надёжности заёмщиков | Заказчик — кредитный отдел банка. Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Входные данные от банка — статистика о платёжеспособности клиентов. | pandas, pymystem3 |
Исследование объявлений о продаже квартир | Дан архив объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах за несколько лет. Нужно научиться определять рыночную стоимость объектов недвижимости. | pandas, matplotlib |
Определение перспективного тарифа для телеком компании | Даны данные 500 пользователей «Мегалайна». Нужно проанализировать поведение клиентов и сделать вывод — какой тариф лучше. | pandas, scipy, matplotlib |
Определить факторы делающие игру уcпешной | Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Требуется выявить определяющие успешность игры закономерности. | pandas, scipy, matplotlib, seaborn |
Построение модели предсказывающей пользователю, подходящий тариф | Оператор мобильной связи «Мегалайн» выяснил: многие клиенты пользуются архивными тарифами. Они хотят построить систему, способную проанализировать поведение клиентов и предложить пользователям новый тариф: «Смарт» или «Ультра». | sklearn, pandas, matplotlib, seaborn, joblib |
Прогнозирование ухода клиента из банка | Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Вам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком. | sklearn, pandas, matplotlib, seaborn |
Прогнозирование количества нефти в скважинах | Построение модели для определения региона, где добыча нефти принесёт наибольшую прибыль. | sklearn, pandas, matplotlib, seaborn, scipy |
Прогнозирование коэффициента восстановления золота из золотосодержащей руды | Компания разрабатывает решения для эффективной работы промышленных предприятий. Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды. В распоряжении данные с параметрами добычи и очистки. | sklearn, pandas, matplotlib, seaborn |
Прогнозирование стоимости автомобиля | Сервис по продаже автомобилей с пробегом разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля. В вашем распоряжении исторические данные: технические характеристики, комплектации и цены автомобилей. Вам нужно построить модель для определения стоимости. | sklearn, pandas, matplotlib, seaborn, catboost, lightgbm |
Прогнозирование количества заказов такси в следующий час | Компания собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. | sklearn, pandas, matplotlib, seaborn, catboost |
Предсказание токсичности комментария | Интернет-магазин запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. | sklearn, pandas, pytorch, transformers, nltk, Bert |