Machine Learning REPA: Reproducibility, Experiments and Pipelines Automation

Инструменты и практики управления экспериментами в Machine Learning, обеспечения воспроизводимости (Reproducibility) и автоматизации процессов.

Ссылка на прошлогодний трек

Расписание выступлений cпикеров и нетворкинга:

29 мая (11:00 - 14:00):

11:00 Cветофор 2.0: страх и ненависть на пути от экселя к градиентному бустингу - Ксения Блажевич , Дмитрий Фокеев
11:40 MLOps Framework - Артем Коваль
12:20 Фреймворк для AutoML FEDOT - Николай Никитин
13:20 Мифическая воспроизводимость в ML разработке - Артем Трофимов 

05 июня (11:00 - 13:30):

11:00 From MLFlow to LMFlow - Наиль Хусаинов
11:40 Тренды REProducible ML - Юлия Антохина
12:20 Что специалист по Data Science может подсмотреть у разработчиков - Дарья Пронина
13:00 Q&A - 4 главные ошибки в процессе разработки AI - Ксения Мельникова, Михаил Рожков


Контакты спикеров: 

Имя/Фамилия/Компания Контакты

Ксения Блажевич
Руководитель практики Data Science Леруа Мерлен Россия и руководитель продукта

E-mail: Ksenia.Blazhevich@leroymerlin.ru
Дмитрий Фокеев 
Менеджер продукта Леруа Мерлен Россия
E-mail: Dmitriy.Fokeev@leroymerlin.ru 
Дарья Пронина ODS: daryaggg 
Артем Трофимов Telegram:  @tyooma
E-mail:  tomato@yandex-team.ru
Наиль Хусаинов Telegram: nkhusainov
E-mail: nail.khusainov@leroymerlin.ru
ODS: nkh
Юлия Антохина
Data Scientist @ Mobile TeleSystems
E-mail:  julia.antokhina.ds@gmail.com 
Ксения Мельникова
Product Owner(Data/AI), SoftwareOne
 
Михаил Рожков
Co-Creator, ML REPA
Solution Engineer, Iterative.ai
Telegram: mnrozhkov
E-mail: mnrozhkov@gmail.com
ODS: mnrozhkov
Артем Коваль E-mail:  artem.koval@clearscale.com
ODS: Art Koval 

 

Доклады и активности секции
29 мая 

Cветофор 2.0: страх и ненависть на пути от экселя к градиентному бустингу
Ксения Блажевич , Дмитрий Фокеев – Леруа Мерлен Россия

Леруа Мерлен - компания с большим количеством оффлайн процессов, в которые мы внедряем ML-решения. 
В докладе расскажем о "Светофоре" - продукте для контроля качества поставок на складах. Поделимся проблемами, с которыми столкнулись на этапе его разработки и внедрения, а также тем, как мы справились с data drift и positive feedback loop.
На примере "Светофора" покажем, как в нашу дата-инфраструктуру вписался ставший "классическим" стек для продуктивизации ML-решений - Kubernetes, Airflow, DVC и собственный model registry на базе S3 и Postgres.


Q&A - Полезные инструменты ML REPA 
ML REPA Speakers

Обсудим полезные инструменты, которые помогают в  DS/ML/AI проектах. Поделимся своим опытом, устроим мозговой штурм с участниками сессии. Приходите со своими вопросами, историями и решениями! 

05 июня 

From MLFlow to LMFlow
Наиль Хусаинов – Леруа Мерлен Россия 

У нас в LMRU (Леруа Мерлен Россия) за 2.5 года существования направления по работе с данными до прода были доведено множество  ML-продуктов. И как любая другая дата команда - мы стремимся максимально стандартизировать  и автоматизировать процесс продуктивизации ML-решений.

В данном докладе я расскажу:

  1. О нашем подходе к стандартизации структуры ML-решений (Инфраструктурные компоненты, структура VCS)
  2. Как мы обеспечиваем воспроизводимость результатов
  3. Как мы мониторим процесс переобучения моделей в проде
  4. Почему, перепробовав несколько популярных инструментов, мы пришли к не самому очевидному решению: написать свой Model Registry и как в него впоследствии вписался DVC

Q&A - 4 главные ошибки в процессе разработки AI
Ксения Мельникова, Михаил Рожков - ML REPA

Обсудим типичные ошибки и сложности, которые возникают в командах AI проектов. Поделимся своим опытом, устроим мозговой штурм с участниками сессии. Приходите со своими вопросами, историями и решениями! 
 

Track program