Romati21 / Job_analysis_from_HH

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Job_analysis_from_HeadHunter

PROJECT-2. Анализ вакансий из HeadHunter

Оглавление

1. Описание проекта
2. Какой кейс решаем?
3. Краткая информация о данных
4. Этапы работы над проектом
5. Результат
6. Выводы

Описание проекта

Анализ вакансий с сайта HeadHunter.

⬆️к оглавлению

Какой кейс решаем?

Сначала нам необходимо понять, что из себя представляют данные и насколько они соответствуют целям проекта. В литературе эта часть работы над ML-проектом называется Data Understanding, или анализ данных.

Наш проект включает в себя несколько этапов:

  • знакомство с данными
  • предварительный анализ данных
  • детальный анализ вакансий
  • анализ работодателей
  • предметный анализ

Требования к оформлению ноутбука-решения:

  • Решение оформляется только в Jupyter Notebook.
  • Решение оформляется в соответствии с ноутбуком-шаблоном.
  • Каждое задание выполняется в отдельной ячейке, выделенной под задание (в шаблоне они помечены как ваш код здесь). Не следует создавать много ячеек для решения задачи — это провоцирует неудобства при проверке.
  • Текст SQL-запросов и код на Python должны быть читаемыми. Не забывайте про отступы в SQL-коде.
  • Выводы по каждому этапу оформляются в формате Markdown в отдельной ячейке (в шаблоне они помечены как ваши выводы здесь).
  • Выводы можно дополнительно проиллюстрировать с помощью графиков. Они оформляются в соответствии с теми правилами, которые мы приводили в модуле по визуализации данных.
  • Не забудьте удалить ячейку с данными соединения перед фиксацией работы в GitHub.

Краткая информация о данных

В нашем распоряжении будет база резюме, выгруженная с сайта поиска вакансий hh.ru

⬆️к оглавлению

Этапы работы над проектом

  • Исследование структуры данных
  • Преобразование данных
  • Исследование зависимостей в данных
  • Очистка данных

⬆️к оглавлению

Результаты:

Данные обработанны и проанализированны, все подробности и выводы в можно посмотреть в ноутбуке.

⬆️к оглавлению

Выводы:

Я испытал на себе основные этапы работы с данными на примере датасета о вакансиях и теперь не понаслышке знаю, как важно уметь правильно работать с данными.

⬆️к оглавлениюи

About


Languages

Language:Jupyter Notebook 100.0%