Ended 9 months ago
53 participants
25 submissions

My First Data Project 2: Улучшаем модели

Вы научитесь подбирать лучшие модели для решения задачи ML.

Еще одна неделя позади. Теперь ты умеешь создавать прототип – круто! 
Сегодня стартует самый большой и трудоемкий модуль. 
У тебя уже есть первая версия сервиса и встроенная туда baseline модель. Пришло время искать лучшую модель и выжимать из нее максимум!

Тебе предстоит найти лучший подход к решению задачи машинного обучения. Какие бы модели и гиперпараметры ты не перепробовал, полученные результаты необходимо сравнить. 

Здесь помогут инструменты версионирования экспериментов. Сравнение наиболее популярных инструментов ты найдешь в прикрепленных ссылках. 

Моя личная рекомендация - Weights and Biases (wandb), ClearML и MLFlow, но ты можешь выбрать любой удобный инструмент или вовсе обойтись без него. Но не забывай, что любое решение всегда должно быть обосновано.

При выборе архитектуры обычно ориентируются не только на качество результатов, но и на быстродействие системы. Две разные модели могут выдавать схожие метрики, однако сильно отличаться по времени обработки одного набора данных. В условиях ограниченных ресурсов или высокой нагруженности быстродействие может стать решающим фактором. Это важно!

В конце модуля мы ожидаем от тебя:

  • краткий отчет о проведенных экспериментах
  • код обучения моделей
  • обоснование выбора моделей и гиперпараметров
  • описание кода обучения

Отчет нужно оформить в README репозитория с проектом.

Ссылки на полезные источники, которые помогут выбрать подходящую модель и оптимизировать гиперпараметры:

  1. Сравнение наиболее популярных инструментов для версионирования экспериментов и моделей: https://neptune.ai/blog/best-ml-experiment-tracking-tools
  2. Обширный курс по нейронным сетям: https://dlcourse.ai/
  3. Русскоязычный вводный курс в нейронные сети и компьютерное зрение: https://stepik.org/course/50352/
  4. Русскоязычный вводный курс в нейронные сети и обработку естественного языка: https://stepik.org/course/54098/
  5. Классический курс по машинному обучению: https://mlcourse.ai/ (серия переводов на Habr: https://habr.com/ru/company/ods/blog/322626/)
  6. Вводный курс в data science и машинное обучение: https://stepik.org/course/4852/
  7. Практические руководства по работе с трансформерами: https://github.com/huggingface/transformers/tree/main/examples/pytorch
  8. YouTube канал Samsung Research Russia, где можно найти много полезных видео по ML: https://www.youtube.com/channel/UCRyd7dU2S-qAbAqRnZhyKIg/featured

Cookies help us deliver our services. By using our services, you agree to our use of cookies.