Ended 2 months ago

Классические модели ML (spring 2025)

Курс про линейные модели и ансамбли из деревьев решений. p.s. И всё остальное, кроме нейросетей.

OpenMLCourse

О курсе

Классические модели машинного обучения - это линейные модели и модели на основе деревьев решений.

Такие модели лучше других справляются с задачами, где разнородные данные, т.н. "табличные данные", т.е. такие, которые часто находятся в базах данных и которые выглядят как таблица: строки - наблюдения, столбцы - признаки.

В отличие от картинок, текстов, аудио, видео, которые представляют из себя огромные объемы данных, причём данные однородны и каждый пиксель или слово зависят от предыдущего. Для таких данных лучшие модели - это нейронные сети.

Курс будет полезен начинающим специалистам, и тем, кто хочет освежить знания по линейным моделям и деревьям.

Общение и вопросы по курсу - в чате https://mm.ods.ai/ods/channels/classic_ml_course

Даты: 10.02.2025 - 07.04.2025

Программа курса и даты

Тема 1. Линейные модели

Темы о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков.

1. Линейная регрессия. 10.02.2025 

Линейная регрессия и чем подход машинного обучения отличается от подхода, который применяется в эконометрике

ДЗ-1 открывается с лекцией, дедлайн 24.02.2025

2. Логистическая регрессия. 17.02.2025

Логистическая регрессия, функция потерь - кросс-энтропия, градиентный спуск и решение численным методом. Предсказание вероятности, пороги принятия решений, матрица ошибок, точность и полнота, F-мера и Gini

ДЗ-2 открывается с лекцией, дедлайн 03.03.2025

3. Выбор модели. 24.02.2025

Стратификация, скользящий контроль, смещение и разброс, валидационная кривая, сколько нужно данных, признаки из текста, времени, выбор признаков

ДЗ-3 открывается с лекцией, дедлайн 10.03.2025

Тема 2. Деревья и их ансамбли

Темы о деревьях и ансамблях: как строится дерево, как создается ансамбль. Разберём градиентный бустинг.

4. Деревья и построение дерева 03.03.2025

ДЗ-4 открывается с лекцией, дедлайн 17.03.2025

5. Виды деревьев, классификация и лес 10.03.2025

ДЗ-5 открывается с лекцией, дедлайн 24.03.2025

6. Градиентный бустинг 17.03.2025

ДЗ-6 открывается с лекцией, дедлайн 31.03.2025

Тема 3. Что ещё может пригодиться, кроме нейросетей

Темы про интерпретацию и причинно-следственные связи, АБ тесты, кластеризацию и снижение размерности.

7. Интерпретация моделей 24.03.2025

ДЗ-7 открывается с лекцией, дедлайн 07.04.2025

8. АБ тесты 31.03.2025

9. Кластеризация и снижение размерности 

Оценка

Каждое ДЗ оценивается по количеству решенных задач (10 баллов за каждую правильно решенную):

ДЗ-1 (макс 100)

ДЗ-2 (макс 100)

ДЗ-3 (макс 50)

ДЗ-4 (макс 70)

ДЗ-5 (макс 30)

ДЗ-6 (макс 40)

ДЗ-7 (макс 40)

После освоения основного материала будет конкурс, где можно заработать столько же баллов сколько за ДЗ (430 за попадание в ТОП-5, 50 за ТОП-45-50).  

Авторы курса

Иван Комаров, КоронаТех, ods.ai, НГУ, https://t.me/getdatakomarov 
Артем Шевляков, Школа компьютерных наук ТюмГУ, https://www.utmn.ru/imkn/shkn/index.php
Георгий Туркия, НГУ

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy