Ends in 1 week

March 27

May 27

MLOps и production подход к ML исследованиям

Продвинутые подходы и инструменты для разработки и внедрения ML-решений в production.

GitLabSnakeMakeMLFlowDVCCI/CDDockerконтейнеризацияCLInexusавтотестыверсионированиевопроизводимостьуправление зависимостямиcodestylegithub-flowлинтерыblackшаблонизацияметодология исследований

28 марта — 28 мая  

Вы научитесь организовывать workflow команды ml-разработки c нуля. Пройдете все шаги создания ML-сервиса от организации репозитория до настройки CI/CD и интеграции ML-модели в эксплуатацию. Освоите концепцию воспроизводимых и масштабируемых исследований. Познакомитесь с популярными инструментами командной разработки: GitLab, SnakeMake, MLFlow, DVC, научитесь унифицировать цикл выпуска моделей машинного обучения и создаваемых на их основе программных продуктов, сможете автоматизировать тестирование производимых артефактов.

Организатор: сообщество Машинное обучение и нейросети на Яндекс.Кью при поддержке Open Data Science

Telegram чат для участников курса: https://t.me/MLopsProduction

Необходимые навыки:

  • Python
  • Машинное обучение
  • Анализ данных

Кому будет полезен курс?

  • ML-инженеры
  • Аналитики и инженеры данных
  • Менеджеры AI-продуктов и руководители (тимлиды) ML-команд

Как поучаствовать?

Войдите с аккаунтом ods.ai и нажмите  "Start the track" в правом верхнем углу.

Следите за обновлениями в нашей группе на Кью, там же вы можете задать любые вопросы связанные с курсом или в нашем телеграм чате для участников курса.

Состав и расписание курса

На курсе вас ждут 9 онлайн занятий, продолжительностью 1,5 - 2 часа, которые будут проходить по понедельникам в 18:30. Все занятия будут доступны в записи. Для дополнительной мотивации будет вестись публичный рейтинг, лучшие участники получат уникальный мерч от ODS.

Участников ждут практические домашние задания, тесты, индивидуальный финальный проект, а так же дополнительные активности и митапы, которые будут предлагаться участникам по ходу курса.

Как набрать баллы рейтинга?

  • проходить тесты (10 баллов за каждый и 90 максимум)
  • выполнить и представить финальный проект (до 50 баллов)
  • написать руководство или провести мастер-класс по теме, связанной с курсом (до 40 баллов)
  • проявлять дополнительную активность - помогать участникам курса отвечая на их вопросы, публиковать оригинальные идеи, решения и подходы по темам и заданиям связанным с курсом (оценивается индивидуально)

Рейтинг будет доступен после закрытия дэдлайна по тестам первой недели - 11 апреля.

Программа курса:

  • Концепция воспроизводимых и масштабируемых исследований. Особенности ML разработки в production. Создание базового ML проекта.
  • Хранение и версионирование кода. Gitlab. Общие принципы Git-flow, Github-flow, настройка репозитория, codereview.
  • Codestyle, инструменты форматирования, линтеры.
  • Шаблонизация. Python пакеты и CLI. Управление зависимостями.
  • Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 1. Make, snakemake, DVC.
  • Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 2. MLflow
  • Разработка сервиса на базе ML моделей. Контейнеризация с Docker.
  • Методы и инструменты тестирования кода и данных
  • CI/CD (GitLab, nexus)

Track program