Ended 2 months ago
Курс про линейные модели и ансамбли из деревьев решений. p.s. И всё остальное, кроме нейросетей.
OpenMLCourse
Классические модели машинного обучения - это линейные модели и модели на основе деревьев решений.
Такие модели лучше других справляются с задачами, где разнородные данные, т.н. "табличные данные", т.е. такие, которые часто находятся в базах данных и которые выглядят как таблица: строки - наблюдения, столбцы - признаки.
В отличие от картинок, текстов, аудио, видео, которые представляют из себя огромные объемы данных, причём данные однородны и каждый пиксель или слово зависят от предыдущего. Для таких данных лучшие модели - это нейронные сети.
Курс будет полезен начинающим специалистам, и тем, кто хочет освежить знания по линейным моделям и деревьям.
Общение и вопросы по курсу - в чате https://mm.ods.ai/ods/channels/classic_ml_course
Даты: 10.02.2025 - 07.04.2025
Тема 1. Линейные моделиТемы о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков. 1. Линейная регрессия. 10.02.2025 Линейная регрессия и чем подход машинного обучения отличается от подхода, который применяется в эконометрике ДЗ-1 открывается с лекцией, дедлайн 24.02.2025 2. Логистическая регрессия. 17.02.2025 Логистическая регрессия, функция потерь - кросс-энтропия, градиентный спуск и решение численным методом. Предсказание вероятности, пороги принятия решений, матрица ошибок, точность и полнота, F-мера и Gini ДЗ-2 открывается с лекцией, дедлайн 03.03.2025 3. Выбор модели. 24.02.2025 Стратификация, скользящий контроль, смещение и разброс, валидационная кривая, сколько нужно данных, признаки из текста, времени, выбор признаков ДЗ-3 открывается с лекцией, дедлайн 10.03.2025 |
Тема 2. Деревья и их ансамблиТемы о деревьях и ансамблях: как строится дерево, как создается ансамбль. Разберём градиентный бустинг. 4. Деревья и построение дерева 03.03.2025 ДЗ-4 открывается с лекцией, дедлайн 17.03.2025 5. Виды деревьев, классификация и лес 10.03.2025 ДЗ-5 открывается с лекцией, дедлайн 24.03.2025 6. Градиентный бустинг 17.03.2025 ДЗ-6 открывается с лекцией, дедлайн 31.03.2025 |
Тема 3. Что ещё может пригодиться, кроме нейросетей Темы про интерпретацию и причинно-следственные связи, АБ тесты, кластеризацию и снижение размерности. 7. Интерпретация моделей 24.03.2025 ДЗ-7 открывается с лекцией, дедлайн 07.04.2025 8. АБ тесты 31.03.2025 9. Кластеризация и снижение размерности |
Каждое ДЗ оценивается по количеству решенных задач (10 баллов за каждую правильно решенную):
ДЗ-1 (макс 100)
ДЗ-2 (макс 100)
ДЗ-3 (макс 50)
ДЗ-4 (макс 70)
ДЗ-5 (макс 30)
ДЗ-6 (макс 40)
ДЗ-7 (макс 40)
После освоения основного материала будет конкурс, где можно заработать столько же баллов сколько за ДЗ (430 за попадание в ТОП-5, 50 за ТОП-45-50).
Иван Комаров, КоронаТех, ods.ai, НГУ, https://t.me/getdatakomarov
Артем Шевляков, Школа компьютерных наук ТюмГУ, https://www.utmn.ru/imkn/shkn/index.php
Георгий Туркия, НГУ
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy