Ended 19 months ago
143 participants
69 submissions

My First Data Project 2: Формулируем задачу в терминах МL

Вы научитесь создавать ML-задачи и сформулируете возможность решения бизнес-задачи с помощью ML.

Ну, что ж, самое сложное позади – выбор кейса для решения. Считай, что полдела сделано!

Сегодня разберем, как формировать ML задачу. Это важный модуль, поскольку его результаты повлияют на твою работу в дальнейшем. Уверен, ты справишься!

Наша цель – понять, как перейти от продуктовых метрик к ML задаче. 

Первое, что нужно сделать – соотнести бизнесовую метрику и метрику МЛ. 
Для этого необходимо выделить целевые переменные в датасете. 
Целевая переменная, с одной стороны, должна быть логически связана с бизнесовой, а с другой стороны – она должна быть применима к машинному обучению. 

Помимо этого необходимо выбрать и обосновать метрики, а также выполнить моделирование влияния ML-метрики на продуктовые. Используя данные для моделирования и величину метрики, можно проверить логичность той или иной модели и в итоге выбрать лучшую.

Не исключено, что получится так, что известная простая метрика может не до конца решать бизнес задачу. В этом случае необходимо самим придумать метрику и построить бейзлайн для её решения.

На этапе формирования ML задачи также необходимо построить baseline. Именно он будет решать задачу машинного обучения. При его построении можно использовать инструменты autoML. Важно помнить, что в этом модуле нет задачи сделать идеальную метрику. Главное показать возможность решения продуктовой задачи с использованием методов машинного обучения.  

По итогу модуля у тебя должна быть сформулирована задача в терминах ML и построен baseline. 

Доп. материалы:

Cookies help us deliver our services. By using our services, you agree to our use of cookies.