Сборный проект-1 |
Исследование компьютерных игр |
Проанализировать исторические данные из открытых источников о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Выявить определяющие успешность игры закономерности. |
pandas, numpy, matplotlib, seaborn, scipy, предобработка данных, исследовательский анализ данных, описательная статистика, проверка статистических гипотез |
Численные методы |
Определение стоимости автомобилей |
Построить модель для определения стоимости автомобилей, модель будет использоваться в мобильном приложении. Учесть качество и скорость предсказаний, время обучения. Метрика RMSE. |
pandas, numpy, matplotlib, seaborn, sklearn, LightGBM, Ridge, CatBoost, GridSearchCV, StandardScaler, OneHotEncoder, машинное обучение, градиентный бустинг |
Статистический анализ данных |
Определение перспективного тарифа для телеком компании |
Проанализировать поведение абонентов и сделать вывод — какой тариф приносит больше денег. |
pandas, matplotlib, seaborn, numpy, scipy, статистический анализ данных, описательная статистика, проверка гипотез |
Введение в машинное обучение |
Рекомендация тарифов |
Проанализировать поведение клиентов и предложить пользователям новый тариф: «Смарт» или «Ультра». На основе данных о поведении клиентов, которые уже перешли на эти тарифы, построить модель со значением accuracy на тестовой выборке выше 0.75. |
pandas, numpy, scikit-learn, supervised learning |
Финальный проект |
Прогнозирование оттока клиентов |
Построить модель для прогнозирования оттока клиентов оператора связи. Метрика ROC-AUC. |
sklearn, LightGBM, CatBoost, Pipeline, ColumnTransformer, GridSearchCV, обучение с учителем, прогнозирование оттока |