Лекции из курса "Машинное обучене и анализ данных"
Математика и Python для анализа данных:
- Основы синтаксиса Python
- Необходимые математические концепции
Обучение на размеченных данных:
- Основыне задачи машинного обучения, виды признаков
- Линейные модели: описание модели, методы решения
- Переобучение и регуляризация, кросс-валидация
- Метрики качества: MSE, MAE, R (коэф. детерминации), квантильная ошибка. Precision, Recall, F-мера. AUC - ROC, AUC - PRC.
- Статистический взгляд на линейные модели
- Практические рекомендации по линейным моделям
- Решающие деревья
- Случайные леса
- Градиентный бустинг
- Нейронные сети
- Байесовская классификация и регрессия
- Метрические алгоритмы и SVM
- Теорема Байеса в машинном обучении
Поиск структуры в данных:
- Введение в кластеризацию
- Подробнее о методах кластеризации
- Понижение размерности и отбор признаков
- Матричные разложения
- Поиск аномалий
- Визуализация данных
- Тематическое моделирование:
- Тематическое моделирование:
Построение выводов по данным:
- Доверительные интервалы
- Проверка гипотез
- Введение в АБ-тесты
- Параметрические критерии
- Непараметрические критерии
- Поиск зависимостей в данных
- Корреляции
- Множественная проверка гипотез
- Регрессия
Прикладные задачи анализа данных:
- Прогнозирование временных рядов
- Компьютерное зрение
- Нейронные сети для анализа изображений
- Практические задачи компьютерного зрения
- Текстовые данные и работа с ними
- Продвинутые методы анализа текстов
- Примеры задач анализа текстов
- Ранжирование
- Рекомендательные системы