hactac9i / statistical_analysis

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Клиентам предлагают два тарифных плана: «Смарт» и «Ультра». Чтобы скорректировать рекламный бюджет, коммерческий департамент хочет понять, какой тариф приносит больше денег. Вам предстоит сделать предварительный анализ тарифов на небольшой выборке клиентов. В вашем распоряжении данные 500 пользователей «Мегалайна»: кто они, откуда, каким тарифом пользуются, сколько звонков и сообщений каждый отправил за 2018 год. Нужно проанализировать поведение клиентов и сделать вывод — какой тариф лучше.

Описание тарифов

Тариф «Смарт»

  1. Ежемесячная плата: 550 рублей
  2. Включено 500 минут разговора, 50 сообщений и 15 Гб интернет-трафика
  3. Стоимость услуг сверх тарифного пакета:
    • минута разговора: 3 рубля
    • сообщение: 3 рубля
    • 1 Гб интернет-трафика: 200 рублей

Тариф «Ультра»

  1. Ежемесячная плата: 1950 рублей
  2. Включено 3000 минут разговора, 1000 сообщений и 30 Гб интернет-трафика
  3. Стоимость услуг сверх тарифного пакета:
    • минута разговора: 1 рубль
    • сообщение: 1 рубль
    • 1 Гб интернет-трафика: 150 рублей

Примечание

«Мегалайн» всегда округляет секунды до минут, а мегабайты — до гигабайт. Каждый звонок округляется отдельно: даже если он длился всего 1 секунду, будет засчитан как 1 минута.

Для веб-трафика отдельные сессии не считаются. Вместо этого общая сумма за месяц округляется в бо́льшую сторону. Если абонент использует 1025 мегабайт в этом месяце, с него возьмут плату за 2 гигабайта.

Примите, что неиспользованные за предыдущий месяц звонки, смс, интернет на следующий месяц не переносятся.

  1. Шаг 1. Откройте файл с данными и изучите общую информацию

  2. Шаг 2. Подготовьте данные:

  • Приведите данные к нужным типам;
  • Найдите и исправьте ошибки в данных, если они есть.
  • Поясните, какие ошибки вы нашли и как их исправили. В данных вы найдёте звонки с нулевой продолжительностью. Это не ошибка: нулями обозначены пропущенные звонки, поэтому их не нужно удалять.
  • Посчитайте для каждого пользователя:
    • количество сделанных звонков и израсходованных минут разговора по месяцам;
    • количество отправленных сообщений по месяцам;
    • объем израсходованного интернет-трафика по месяцам;
    • помесячную выручку с каждого пользователя (вычтите бесплатный лимит из суммарного количества звонков, сообщений и интернет-трафика; остаток умножьте на значение из тарифного плана; прибавьте абонентскую плату, соответствующую тарифному плану).
  1. Шаг 3. Проанализируйте данные
  • Опишите поведение клиентов оператора, исходя из выборки. Сколько минут разговора, сколько сообщений и какой объём интернет-трафика требуется пользователям каждого тарифа в месяц?
  • Посчитайте среднее количество, дисперсию и стандартное отклонение.
  • Постройте гистограммы. Опишите распределения.
  1. Шаг 4. Проверьте гипотезы:
  • средняя выручка пользователей тарифов «Ультра» и «Смарт» различаются;
  • средняя выручка пользователей из Москвы отличается от выручки пользователей из других регионов.
  • Пороговое значение alpha задайте самостоятельно.
  • Поясните:
    • как вы формулировали нулевую и альтернативную гипотезы;
    • какой критерий использовали для проверки гипотез и почему.
  1. Шаг 5. Напишите общий вывод

Оформление: Задание выполните в Jupyter Notebook. Программный код заполните в ячейках типа code, текстовые пояснения — в ячейках типа markdown. Примените форматирование и заголовки.

About


Languages

Language:Jupyter Notebook 100.0%