Ended 3 years ago

MLOps и production подход к ML исследованиям

Продвинутые подходы и инструменты для разработки и внедрения ML-решений в production.

GitLabSnakeMakeMLFlowDVCCI/CDDockerконтейнеризацияCLInexusавтотестыверсионированиевопроизводимостьуправление зависимостямиcodestylegithub-flowлинтерыblackшаблонизацияметодология исследований

28 марта — 28 мая  

Вы научитесь организовывать workflow команды ml-разработки c нуля. Пройдете все шаги создания ML-сервиса от организации репозитория до настройки CI/CD и интеграции ML-модели в эксплуатацию. Освоите концепцию воспроизводимых и масштабируемых исследований. Познакомитесь с популярными инструментами командной разработки: GitLab, SnakeMake, MLFlow, DVC, научитесь унифицировать цикл выпуска моделей машинного обучения и создаваемых на их основе программных продуктов, сможете автоматизировать тестирование производимых артефактов.

Организатор: сообщество Машинное обучение и нейросети на Яндекс.Кью при поддержке Open Data Science

Telegram чат для участников курса: https://t.me/MLopsProduction

Необходимые навыки:

  • Python
  • Машинное обучение
  • Анализ данных

Кому будет полезен курс?

  • ML-инженеры
  • Аналитики и инженеры данных
  • Менеджеры AI-продуктов и руководители (тимлиды) ML-команд

Как поучаствовать?

Войдите с аккаунтом ods.ai и нажмите  "Start the track" в правом верхнем углу.

Следите за обновлениями в нашей группе на Кью, там же вы можете задать любые вопросы связанные с курсом или в нашем телеграм чате для участников курса.

Состав и расписание курса

На курсе вас ждут 9 онлайн занятий, продолжительностью 1,5 - 2 часа, которые будут проходить по понедельникам в 18:30. Все занятия будут доступны в записи. Для дополнительной мотивации будет вестись публичный рейтинг, лучшие участники получат уникальный мерч от ODS.

Участников ждут практические домашние задания, тесты, индивидуальный финальный проект, а так же дополнительные активности и митапы, которые будут предлагаться участникам по ходу курса.

Как набрать баллы рейтинга?

  • проходить тесты (10 баллов за каждый и 90 максимум)
  • выполнить и представить финальный проект (до 50 баллов)
  • написать руководство или провести мастер-класс по теме, связанной с курсом (до 40 баллов)
  • проявлять дополнительную активность - помогать участникам курса отвечая на их вопросы, публиковать оригинальные идеи, решения и подходы по темам и заданиям связанным с курсом (оценивается индивидуально)

Рейтинг будет доступен после закрытия дэдлайна по тестам первой недели - 11 апреля.

Программа курса:

  • Концепция воспроизводимых и масштабируемых исследований. Особенности ML разработки в production. Создание базового ML проекта.
  • Хранение и версионирование кода. Gitlab. Общие принципы Git-flow, Github-flow, настройка репозитория, codereview.
  • Codestyle, инструменты форматирования, линтеры.
  • Шаблонизация. Python пакеты и CLI. Управление зависимостями.
  • Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 1. Make, snakemake, DVC.
  • Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 2. MLflow
  • Разработка сервиса на базе ML моделей. Контейнеризация с Docker.
  • Методы и инструменты тестирования кода и данных
  • CI/CD (GitLab, nexus)

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy