Асташов И.В., 2024.
Проект выполнен в рамках курса «Машинное обучение» магистерской программы НИУ ВШЭ «Машинное обучение и высоконагруженные системы».
Цель: Создать модель, использующую решающие деревья, для предсказания уровня удовлетворенности клиентов полетами.
Задачи:
- Провести разведочный анализ данных и выполнить их предобработку;
- Построить модель решающих деревьев для бинарной классификации;
- Оценить важность признаков, визуализировать дерево, провести прунинг;
- Обучить случайный лес и провести калибровку его вероятностей;
- Оценить разброс и смещение моделей и сравнить их;
- Подобрать оптимальные гиперпараметры для случайного леса;
- Проанализировать важность признаков с использованием SHAP и LIME;
- Провести поиск оптимальных гиперпараметров для случайного леса с использованием Optuna.
- Оценка распределений признаков;
- Заполнение пропусков;
- Удаление выбросов;
- Логарифмирование признаков;
- Кодирование признаков.
- Оценка важности признаков;
- Визуализация дерева принятия решений;
- Построение разделяющей поверности;
- Процесс прунинга дерева;
- Обучение случайного леса и калибровка его вероятностей используя изотоническую и логистическую регрессию;
- Оценка разброса и смещений моделей;
- Подбор оптимальных гиперпараметров с помощью GridSearchCV;
- Интерпретация важности признаков с использованием SHAP и LIME;
- Поиск оптимальных гиперпараметров с использованием Optuna.
Шаги выполнены с целью улучшения качества модели и ее интерпретируемости.