Ends in 6 weeks
Курс про линейные модели и ансамбли из деревьев решений. p.s. И всё остальное, кроме нейросетей.
OpenMLCourse
Классические модели машинного обучения - это линейные модели и модели на основе деревьев решений.
Такие модели лучше других справляются с задачами, где разнородные данные, т.н. "табличные данные", т.е. такие, которые часто находятся в базах данных и которые выглядят как таблица: строки - наблюдения, столбцы - признаки.
В отличие от картинок, текстов, аудио, видео, которые представляют из себя огромные объемы данных, причём данные однородны и каждый пиксель или слово зависят от предыдущего. Для таких данных лучшие модели - это нейронные сети.
Курс будет полезен начинающим специалистам, и тем, кто хочет освежить знания по линейным моделям и деревьям.
Общение и вопросы по курсу - в чате https://mm.ods.ai/ods/channels/classic_ml_course
Даты: 10.02.2025 - 07.04.2025
Тема 1. Линейные моделиТемы о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков. 1. Линейная регрессия. 10.02.2025 Линейная регрессия и чем подход машинного обучения отличается от подхода, который применяется в эконометрике ДЗ-1 открывается с лекцией, дедлайн 24.02.2025 2. Логистическая регрессия. 17.02.2025 Логистическая регрессия, функция потерь - кросс-энтропия, градиентный спуск и решение численным методом. Предсказание вероятности, пороги принятия решений, матрица ошибок, точность и полнота, F-мера и Gini ДЗ-2 открывается с лекцией, дедлайн 03.03.2025 3. Выбор модели. 24.02.2025 Стратификация, скользящий контроль, смещение и разброс, валидационная кривая, сколько нужно данных, признаки из текста, времени, выбор признаков ДЗ-3 открывается с лекцией, дедлайн 10.03.2025 |
Тема 2. Деревья и их ансамблиТемы о деревьях и ансамблях: как строится дерево, как создается ансамбль. Разберём градиентный бустинг. 4. Деревья и построение дерева 03.03.2025 ДЗ-4 открывается с лекцией, дедлайн 17.03.2025 5. Виды деревьев, классификация и лес 10.03.2025 ДЗ-5 открывается с лекцией, дедлайн 24.03.2025 6. Градиентный бустинг 17.03.2025 ДЗ-6 открывается с лекцией, дедлайн 31.03.2025 |
Тема 3. Что ещё может пригодиться, кроме нейросетей Темы про интерпретацию и причинно-следственные связи, АБ тесты, кластеризацию и снижение размерности. 7. Интерпретация моделей 24.03.2025 ДЗ-7 открывается с лекцией, дедлайн 07.04.2025 8. АБ тесты 31.03.2025 9. Кластеризация и снижение размерности 07.04.2025 |
Каждое ДЗ оценивается по количеству решенных задач (10 баллов за каждую правильно решенную):
ДЗ-1 (макс 100)
ДЗ-2 (макс 100)
ДЗ-3 (макс 50)
ДЗ-4 (макс 50)
ДЗ-5 (макс 30)
ДЗ-6 (макс 40)
ДЗ-7 (макс 40)
После освоения основного материала будет конкурс, где можно заработать столько же баллов сколько за ДЗ (410 за попадание в ТОП-5, или меньше, согласно скору вашему и участников).
Иван Комаров, КоронаТех, ods.ai, НГУ, https://t.me/getdatakomarov
Артем Шевляков, Школа компьютерных наук ТюмГУ, https://www.utmn.ru/imkn/shkn/index.php
Георгий Туркия, НГУ
Cookies help us deliver our services. By using our services, you agree to our use of cookies.