oKatanaaa / DS_SamU

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Материалы курса "Инструменты анализа данных" 2022

Для изучения курса вам потребуются:

Лабораторные работы

  1. NumPy
  2. Pandas
  3. Визуализация данных
  4. Классификация в sklearn (многоклассовая, бинарная)
  5. Деревья решений
  6. Catboost (классификация, регрессия)
  7. Линейная регрессия в sklearn
  8. Основы tensorflow
  9. Классификация/регрессия в tensorflow
  10. Деревья решений в tensorflow
  11. Tensorboard - средство визуализации в tensorflow
  12. Классификация текстов (с помощью TfIdf + LogisticRegression)
  13. Кластеризация
  14. Понижение размерности признакового пространства

Требования к датасетам

  • Наличие числовых признаков, не только категориальных
  • Не использовать датасеты из лекций, titanic и iris датасеты
  • Датасеты не должны повторяться
  • Датасет должен быть указан в таблице

Требования к оформлению лабораторных работ:

  • Лабораторные работы выполняются в jupyter-блокнотах, достаточно загрузить блокнот из данного репозитория и изменить имя файла
  • Необходимо комментирование кода и результатов

Датасеты:

Откуда брать датасеты для работ?

Репозитории с датасетами:

Всяческие открытые данные:

Полезные ссылки

About


Languages

Language:Jupyter Notebook 100.0%