Starts in 19 hours

Классические модели ML (autumn 2025)

Курс про линейные модели и ансамбли из деревьев решений. Обновленные домашки!

OpenMLCourse

О курсе

Классические модели машинного обучения - это линейные модели и модели на основе деревьев решений.

Такие модели лучше других справляются с задачами, где разнородные данные, т.н. "табличные данные", т.е. такие, которые часто находятся в базах данных и которые выглядят как таблица: строки - наблюдения, столбцы - признаки.

В отличие от картинок, текстов, аудио, видео, которые представляют из себя огромные объемы данных, причём данные однородны и каждый пиксель или слово зависят от предыдущего. Для таких данных лучшие модели - это нейронные сети.

Курс будет полезен начинающим специалистам, и тем, кто хочет освежить знания по линейным моделям и деревьям.

Общение и вопросы по курсу - в чате https://mm.ods.ai/ods/channels/classic_ml_course

Даты: 18.09.2025 - 20.11.2025

Программа курса и даты

Тема 1. Линейные модели

Темы о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков.

1. Линейная регрессия. 18.09.2025 

Линейная регрессия и чем подход машинного обучения отличается от подхода, который применяется в эконометрике

ДЗ-1 открывается с лекцией, дедлайн 02.10.2025

2. Логистическая регрессия. 25.09.2025

Логистическая регрессия, функция потерь - кросс-энтропия, градиентный спуск и решение численным методом. Предсказание вероятности, пороги принятия решений, матрица ошибок, точность и полнота, F-мера и Gini

ДЗ-2 открывается с лекцией, дедлайн 09.10.2025

3. Выбор модели. 02.10.2025

Стратификация, скользящий контроль, смещение и разброс, валидационная кривая, сколько нужно данных, признаки из текста, времени, выбор признаков

ДЗ-3 открывается с лекцией, дедлайн 16.10.2025

Тема 2. Деревья и их ансамбли

Темы о деревьях и ансамблях: как строится дерево, как создается ансамбль. Разберём градиентный бустинг.

4. Деревья и построение дерева 09.10.2025

ДЗ-4 открывается с лекцией, дедлайн 23.10.2025

5. Виды деревьев, классификация и лес 16.10.2025

ДЗ-5 открывается с лекцией, дедлайн 30.10.2025

6. Градиентный бустинг 23.10.2025

ДЗ-6 открывается с лекцией, дедлайн 06.11.2025

Тема 3. Что ещё может пригодиться, кроме нейросетей

Темы про интерпретацию и причинно-следственные связи, АБ тесты, кластеризацию и снижение размерности.

7. Интерпретация моделей 30.10.2025

ДЗ-7 открывается с лекцией, дедлайн 13.11.2025

8. АБ тесты 06.11.2025

9. Кластеризация и снижение размерности 13.11.2025

Оценка

Каждое ДЗ оценивается по количеству решенных задач (разное кол-во баллов в зависимости от сложности задачи):

ДЗ-1 (макс 68)

ДЗ-2 (макс 62)

ДЗ-3 (макс 56)

ДЗ-4 (макс ..)

ДЗ-5 (макс ..)

ДЗ-6 (макс ..)

ДЗ-7 (макс ..)

После освоения основного материала будет конкурс, где можно заработать столько же баллов, сколько за ДЗ за попадание в ТОП-5 (и пропорционально меньше, если место ниже).

Авторы курса

Иван Комаров, КоронаТех, ods.ai, НГУ, https://t.me/getdatakomarov 
Артем Шевляков, Школа компьютерных наук ТюмГУ, https://www.utmn.ru/imkn/shkn/index.php
Дмитрий Лапочкин, НГУ
Георгий Туркия, НГУ
 

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy