My First Data Project 2: Улучшаем модели

Вы научитесь подбирать лучшие модели для решения задачи ML.

Еще одна неделя позади. Теперь ты умеешь создавать прототип – круто!
Сегодня стартует самый большой и трудоемкий модуль.
У тебя уже есть первая версия сервиса и встроенная туда baseline модель. Пришло время искать лучшую модель и выжимать из нее максимум!

Тебе предстоит найти лучший подход к решению задачи машинного обучения. Какие бы модели и гиперпараметры ты не перепробовал, полученные результаты необходимо сравнить.

Здесь помогут инструменты версионирования экспериментов. Сравнение наиболее популярных инструментов ты найдешь в прикрепленных ссылках.

Моя личная рекомендация - Weights and Biases (wandb), ClearML и MLFlow, но ты можешь выбрать любой удобный инструмент или вовсе обойтись без него. Но не забывай, что любое решение всегда должно быть обосновано.

При выборе архитектуры обычно ориентируются не только на качество результатов, но и на быстродействие системы. Две разные модели могут выдавать схожие метрики, однако сильно отличаться по времени обработки одного набора данных. В условиях ограниченных ресурсов или высокой нагруженности быстродействие может стать решающим фактором. Это важно!

В конце модуля мы ожидаем от тебя:

краткий отчет о проведенных экспериментах
код обучения моделей
обоснование выбора моделей и гиперпараметров
описание кода обучения

Отчет нужно оформить в README репозитория с проектом.

Ссылки на полезные источники, которые помогут выбрать подходящую модель и оптимизировать гиперпараметры:

Сравнение наиболее популярных инструментов для версионирования экспериментов и моделей: https://neptune.ai/blog/best-ml-experiment-tracking-tools
Обширный курс по нейронным сетям: https://dlcourse.ai/
Русскоязычный вводный курс в нейронные сети и компьютерное зрение: https://stepik.org/course/50352/
Русскоязычный вводный курс в нейронные сети и обработку естественного языка: https://stepik.org/course/54098/
Классический курс по машинному обучению: https://mlcourse.ai/ (серия переводов на Habr: https://habr.com/ru/company/ods/blog/322626/)
Вводный курс в data science и машинное обучение: https://stepik.org/course/4852/
Практические руководства по работе с трансформерами: https://github.com/huggingface/transformers/tree/main/examples/pytorch
YouTube канал Samsung Research Russia, где можно найти много полезных видео по ML: https://www.youtube.com/channel/UCRyd7dU2S-qAbAqRnZhyKIg/featured

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy

Learn More