необходимо исследовать влияние характеристик клиентов, которых страховая компания обслуживает, на размер страховых выплат
Страховая компания обратилась за помощью к вам, опытному специалисту по данным, с задачей исследования влияния характеристик клиентов на размер годовых страховых выплат. Компания также хочет выявить другие взаимосвязи в данных.
Основные вопросы, на которые необходимо ответить:
- Больше ли страховые выплаты у мужчин по сравнению с женщинами?
- Меньше ли страховые выплаты у некурящих по сравнению с курящими?
- Влияет ли регион проживания на размер выплат?
- Существует ли взаимосвязь между курением и полом клиента?
Для ответов на эти вопросы будет использоваться уровень значимости
Исследование основано на данных о годовых страховых выплатах с учетом характеристик клиентов.
Используемые библиотеки: pandas, numpy, scipy, statsmodels, matplotlib, seaborn.
Данные загружены с платформы Kaggle и доступны по ссылке.
Выполнена очистка данных, обработка пропусков, создание новых признаков.
Проведен анализ распределения страховых выплат в зависимости от различных характеристик клиентов: пола, курения, региона проживания. Выявлены основные тенденции и возможные аномалии.
Применены различные статистические тесты для проверки гипотез о взаимосвязи характеристик клиентов со страховыми выплатами:
- Тест Шапиро-Уилка на нормальность распределения;
- U-критерий Манна-Уитни для сравнения двух независимых выборок;
- Критерий Краскела-Уоллиса для сравнения нескольких групп;
- Критерий хи-квадрат для анализа взаимосвязи между категориальными переменными.
- Не обнаружено статистически значимых различий в размере страховых выплат между мужчинами и женщинами.
- Выплаты для некурящих клиентов статистически меньше, чем для курящих.
- Регион проживания не влияет на размер страховых выплат.
- Найдена взаимосвязь между курением и полом клиентов.
Исследование показало важность учета курения при определении размера страховых выплат и выявило отсутствие дискриминации по полу и региону проживания в страховых выплатах.
Проект распространяется под лицензией MIT. Вы можете свободно использовать и распространять этот код для личных и коммерческих целей с обязательной ссылкой на автора.