Введение в машинное обучение. Курс от ВШЭ и ШАД на coursera.org
В процессе прохождения курса слушатель изучает основные типы задач, решаемых с помощью машинного обучения — в основном речь идёт о классификации, регрессии и кластеризации. Узнает об основных методах машинного обучения и их особенностях, учится оценивать качество моделей — и решать, подходит ли модель для решения конкретной задачи. Наконец, знакомится с современными библиотеками, в которых реализованы обсуждаемые модели и методы оценки их качества.
Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах. Для выполнения практических заданий потребуются базовые навыки программирования. Желательно знать Python.
Программа курса
Неделя 1. Введение. Примеры задач. Логические методы: решающие деревья и решающие леса.
- Предобработка данных в Pandas
- Важность признаков
Неделя 2. Метрические методы классификации. Линейные методы, стохастический градиент.
- Выбор числа соседей
- Выбор метрики
- Нормализация признаков
Неделя 3. Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации.
- Опорные объекты
- Анализ текстов
- Логистическая регрессия
- Метрики качества классификации
Неделя 4. Линейная регрессия. Понижение размерности, метод главных компонент.
- Линейная регрессия: прогноз оклада по описанию вакансии
- Составление фондового индекса
Неделя 5. Композиции алгоритмов, градиентный бустинг. Нейронные сети.
- Размер случайного леса
- Градиентный бустинг над решающими деревьями
Неделя 6. Кластеризация и визуализация. Частичное обучение.
- Уменьшение количества цветов изображения
Неделя 7. Прикладные задачи анализа данных: постановки и методы решения.
- Проект: предсказания победителя в онлайн-игре