<h3><strong>Рекомендации по составу и характеристикам собственного ML проекта используемого по ходу курса:</strong></h3><ul><li>Чтение и слияние исходных данных из различных файлов/форматов</li><li>Умеренный размер данных для удобства хранения промежуточных артефактов и их версионирования</li><li>EDA (графики по имеющимся значениям;&nbsp; проверка распределения данных/стационарность, расчет стандартных статистических характеристик - среднее, медиану и т.д.);</li><li>Предобработка данных (исправление некорректных значений и выбросов,&nbsp; фильтрация, замена пропусков и т.д.);</li><li>Расширение датасета путем получения данных из внешних источников через API, парсинг страниц и т.п.;</li><li>Инжиниринг данных;</li><li>Использование нескольких ML алгоритмов для построения моделей (для последующего сравнительного анализа)</li><li>Несколько метрик качества.</li></ul><p>Соблюдение данных рекомендаций позволит полноценно использовать все инструменты и приемы, рассматриваемые в рамках курса.</p>

Теория

Концепция воспроизводимых и масштабируемых исследований

Квест

Тест 1

Gitlab. Общие принципы Git-flow, Github-flow, настройка репозитория, codereview

Хранение и версионирование кода

Тест 2

Codestyle, инструменты форматирования, линтеры

Тест 3

Шаблонизация. Python пакеты и CLI. Snakemake

Тест 4

Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 1.

Make, snakemake, DVC

Тест 5

Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 2

MLflow

Тест 6

Разработка сервиса на базе ML моделей. Контейнеризация с Docker

Тест 7

Методы и инструменты тестирования кода и данных

Тест 8

CI/CD (GitLab, nexus)

FeaturedBanner-7c2f9f7a

Чат курса

<h4><strong>28&nbsp;марта &mdash; 28&nbsp;мая&nbsp;&nbsp;</strong></h4>

<p>Вы научитесь организовывать&nbsp;workflow&nbsp;команды ml-разработки c&nbsp;нуля. Пройдете все шаги создания ML-сервиса от организации репозитория до настройки CI/CD&nbsp;и интеграции ML-модели в эксплуатацию. Освоите концепцию воспроизводимых и масштабируемых исследований. Познакомитесь с популярными инструментами командной разработки: GitLab, SnakeMake, MLFlow, DVC, научитесь унифицировать цикл выпуска моделей машинного обучения и создаваемых на их основе программных продуктов, сможете автоматизировать тестирование производимых артефактов.</p>

<h4><strong>Организатор</strong>: сообщество <a href="https://yandex.ru/q/loves/machine-learning/" rel="noopener noreferrer" target="_blank"><strong>Машинное обучение и нейросети</strong></a> на Яндекс.Кью при поддержке <a href="https://ods.ai/" rel="noopener noreferrer" target="_blank"><strong>Open Data Science</strong></a></h4>

<p><strong>Telegram чат для участников курса:</strong> <a href="https://t.me/MLopsProduction" rel="noopener noreferrer" target="_blank">https://t.me/MLopsProduction</a></p>

<h3><strong>Необходимые навыки:</strong></h3>

<ul>
<li>Python</li>
<li>Машинное обучение</li>
<li>Анализ данных</li>
</ul>

<h3><strong>Кому будет полезен курс?</strong></h3>

<ul>
<li>ML-инженеры</li>
<li>Аналитики и инженеры данных</li>
<li>Менеджеры AI-продуктов и руководители (тимлиды) ML-команд</li>
</ul>

<h3><strong>Как поучаствовать?</strong></h3>

<p>Войдите&nbsp;с аккаунтом&nbsp;<a href="https://vk.com/away.php?to=http%3A%2F%2Fods.ai&amp;post=-158557357_1172&amp;cc_key=" rel="noopener noreferrer" target="_blank">ods.ai</a> и нажмите &nbsp;&quot;Start the track&quot; в правом верхнем углу.</p>

<p>Следите за обновлениями в нашей группе на <a href="https://yandex.ru/q/loves/machine-learning/" rel="noopener noreferrer" target="_blank"><strong>Кью</strong></a>, там же вы можете задать любые вопросы связанные с курсом или в нашем <a href="https://t.me/MLopsProduction" rel="noopener noreferrer" target="_blank"><strong>телеграм чате</strong></a><strong> </strong>для участников курса.</p>

<h3>Состав и расписание курса</h3>

<p>На курсе вас ждут <strong>9 онлайн занятий</strong>, продолжительностью 1,5 - 2 часа, которые будут проходить по <strong>понедельникам </strong>в<strong> 18:30. </strong>Все занятия будут доступны в записи. Для дополнительной мотивации будет вестись <strong>публичный рейтинг, </strong>лучшие участники получат уникальный мерч от <strong>ODS</strong>.</p>

<p>Участников ждут практические домашние задания, тесты, индивидуальный финальный проект, а так же дополнительные активности и митапы, которые будут предлагаться участникам по ходу курса.</p>

<h3>Как набрать баллы рейтинга?</h3>

<ul>
<li>проходить тесты (10 баллов за каждый и 90 максимум)</li>
<li>выполнить и представить финальный проект (до 50 баллов)</li>
<li>написать руководство или провести мастер-класс по теме, связанной с курсом (до 40 баллов)</li>
<li>проявлять дополнительную активность - помогать участникам курса отвечая на их вопросы, публиковать оригинальные идеи, решения и подходы по темам и заданиям связанным с курсом (оценивается индивидуально)</li>
</ul>

<p><strong>Рейтинг будет доступен</strong> после закрытия дэдлайна по тестам первой недели - <strong>11 апреля</strong>.</p>

<h3><strong>Программа курса:</strong></h3>

<ul>
<li>Концепция воспроизводимых и масштабируемых исследований. Особенности ML разработки в production. Создание базового ML проекта.</li>
<li>Хранение и версионирование кода. Gitlab. Общие принципы Git-flow, Github-flow, настройка репозитория, codereview.</li>
<li>Codestyle, инструменты форматирования, линтеры.</li>
<li>Шаблонизация. Python пакеты и CLI. Управление зависимостями.</li>
<li>Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 1. Make, snakemake, DVC.</li>
<li>Инструменты автоматизации воспроизводимых масштабируемых исследований, часть 2. MLflow</li>
<li>Разработка сервиса на базе ML моделей. Контейнеризация с Docker.</li>
<li>Методы и инструменты тестирования кода и данных</li>
<li>CI/CD (GitLab, nexus)</li>
</ul>

Продвинутые подходы и инструменты для разработки и внедрения ML-решений в production.

leaderboard

Защиты проектов

Старт курса!

Митапы

User Agreement

<p>I accept <a href="https://storage.yandexcloud.net/datasouls-ods/CourseFest_1/Docs/UserAgreement.pdf" rel="noopener noreferrer" target="_blank">Terms of User Agreement and Privacy Policy</a></p>

Privacy Policy

<p>I give my <a href="https://storage.yandexcloud.net/datasouls-ods/CourseFest_1/Docs/Consent.pdf" rel="noopener noreferrer" target="_blank">consent</a> to &laquo;Sorevnovaniya Analiza Dannykh&raquo; LLC to process and transfer my personal data to the partners of the event for information interaction</p>

Consent

<p>I <a href="https://storage.yandexcloud.net/datasouls-ods/CourseFest_1/Docs/Email.pdf" rel="noopener noreferrer" target="_blank">agree</a> to receive newsletters from &laquo;Sorevnovaniya Analiza Dannykh&raquo; LLC</p>