Ends in 6 weeks

February 10

April 7

Классические модели ML (spring 2025)

Курс про линейные модели и ансамбли из деревьев решений. p.s. И всё остальное, кроме нейросетей.

OpenMLCourse

О курсе

Классические модели машинного обучения - это линейные модели и модели на основе деревьев решений.

Такие модели лучше других справляются с задачами, где разнородные данные, т.н. "табличные данные", т.е. такие, которые часто находятся в базах данных и которые выглядят как таблица: строки - наблюдения, столбцы - признаки.

В отличие от картинок, текстов, аудио, видео, которые представляют из себя огромные объемы данных, причём данные однородны и каждый пиксель или слово зависят от предыдущего. Для таких данных лучшие модели - это нейронные сети.

Курс будет полезен начинающим специалистам, и тем, кто хочет освежить знания по линейным моделям и деревьям.

Общение и вопросы по курсу - в чате https://mm.ods.ai/ods/channels/classic_ml_course

Даты: 10.02.2025 - 07.04.2025

Программа курса и даты

Тема 1. Линейные модели

Темы о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков.

1. Линейная регрессия. 10.02.2025 

Линейная регрессия и чем подход машинного обучения отличается от подхода, который применяется в эконометрике

ДЗ-1 открывается с лекцией, дедлайн 24.02.2025

2. Логистическая регрессия. 17.02.2025

Логистическая регрессия, функция потерь - кросс-энтропия, градиентный спуск и решение численным методом. Предсказание вероятности, пороги принятия решений, матрица ошибок, точность и полнота, F-мера и Gini

ДЗ-2 открывается с лекцией, дедлайн 03.03.2025

3. Выбор модели. 24.02.2025

Стратификация, скользящий контроль, смещение и разброс, валидационная кривая, сколько нужно данных, признаки из текста, времени, выбор признаков

ДЗ-3 открывается с лекцией, дедлайн 10.03.2025

Тема 2. Деревья и их ансамбли

Темы о деревьях и ансамблях: как строится дерево, как создается ансамбль. Разберём градиентный бустинг.

4. Деревья и построение дерева 03.03.2025

ДЗ-4 открывается с лекцией, дедлайн 17.03.2025

5. Виды деревьев, классификация и лес 10.03.2025

ДЗ-5 открывается с лекцией, дедлайн 24.03.2025

6. Градиентный бустинг 17.03.2025

ДЗ-6 открывается с лекцией, дедлайн 31.03.2025

Тема 3. Что ещё может пригодиться, кроме нейросетей

Темы про интерпретацию и причинно-следственные связи, АБ тесты, кластеризацию и снижение размерности.

7. Интерпретация моделей 24.03.2025

ДЗ-7 открывается с лекцией, дедлайн 07.04.2025

8. АБ тесты 31.03.2025

9. Кластеризация и снижение размерности 07.04.2025

Оценка

Каждое ДЗ оценивается по количеству решенных задач (10 баллов за каждую правильно решенную):

ДЗ-1 (макс 100)

ДЗ-2 (макс 100)

ДЗ-3 (макс 50)

ДЗ-4 (макс 50)

ДЗ-5 (макс 30)

ДЗ-6 (макс 40)

ДЗ-7 (макс 40)

После освоения основного материала будет конкурс, где можно заработать столько же баллов сколько за ДЗ (410 за попадание в ТОП-5, или меньше, согласно скору вашему и участников).  

Авторы курса

Иван Комаров, КоронаТех, ods.ai, НГУ, https://t.me/getdatakomarov 
Артем Шевляков, Школа компьютерных наук ТюмГУ, https://www.utmn.ru/imkn/shkn/index.php
Георгий Туркия, НГУ

Track program

Cookies help us deliver our services. By using our services, you agree to our use of cookies.