r4dm / yandex-datascience

Projects from Yandex Practicum (Data Science)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Yandex.Praktikum Data Science Projects

Репозиторий с проектами, созданными в рамках курса "Специалист Data Science" в Яндекс.Практикуме

О курсе / About program

Содержание: / Content:

Проекты

Название Общая информация Стек технологий
13 (Дипломный проект) Прогнозирование оттока клиентов оператора связи Необходимо научиться с высокой точностью прогнозировать отток клиентов телеком-оператора. Это позволит своевременно предложить промокоды и бонусы и сохранить клиента. catboost sklearn seaborn matplotlib plotly pandas numpy math
12 (Обработка естественного языка) Определение токсичности комментариев Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. Для этого необходимо обучить модель классифицировать комментарии на позитивные и негативные BERT spacy SVC pymystem3 re sklearn pandas numpy matplotlib plotly math
11 (Временные ряды) Прогноз количества заказов такси на следующий час Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. TimeSeriesSplit catboost lightgbm statsmodels sklearn pandas numpy matplotlib plotly math time
10 Определение стоимости автомобилей Необходимо построить модель для определения стоимости автомобиля, с учетом ограничений обозначенных заказчиком catboost lightgbm sklearn pandas numpy matplotlib plotly math time
9 Разработать метод преобразования данных для защиты персональной информации Необходимо разработать метод преобразования данных, согласно которому будет сложно восстановить персональную информацию. Обосновать корректность его работы. sklearn pandas numpy
8 Предсказание коэффициента восстановления золота из золотосодержащей руды Нужно построить модель, которая предскажет коэффициент восстановления золота из золотосодержащей руды по данным с параметрами добычи и очистки. sklearn matplotlib plotly pandas numpy
7 Выбор локации для нефтяной скважины Нефтяной компании нужно решить, где бурить новую скважину. Для этого необходимо построить модель для определения региона, где добыча принесёт наибольшую прибыль. sklearn scipy matplotlib plotly pandas numpy
6 Прогнозирование оттока клиентов банка Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет sklearn pandas numpy matplotlib
5 Рекомендация тарифов существующим клиентам Необходимо построить систему, способную проанализировать поведение клиентов, давно не меняющих тарифные планы, и предложить пользователям новый тариф, отвечающий их предпочтениям. sklearn pandas
4 Определение параметров коммерческой успешности компьютерных игр Необходимо выявить определяющие успешность игры закономерности, чтобы сделать ставку на потенциально популярный продукт и спланировать рекламные кампании scipy matplotlib plotly pandas numpy math
3 Определение перспективного тарифа для телеком-компании Чтобы скорректировать рекламный бюджет нужно проанализировать, как клиенты пользуются сотовой связью, и сделать вывод, — какой из предлагаемых федеральным оператором тарифов приносит больше денег. scipy pandas numpy plotly math
2 Исследование объявлений о продаже квартир На базе архива объявлений о продаже квартир в Санкт-Петербурге и соседних городах провести EDA. Цель - определить параметры, чтобы в дальнейшем научиться определять рыночную стоимость объектов недвижимости matplotlib plotly pandas numpy math
1 Исследование надёжности заёмщиков Исследование надёжности заёмщиков для кредитного отдела банка с целью построения модели кредитного скоринга pymystem3 pandas numpy collections math

Контакты

About

Projects from Yandex Practicum (Data Science)


Languages

Language:Jupyter Notebook 100.0%