Data Scientist (A/B Platform)

Posted:
Remote or office
Full-time

MLData ScientistFashion AI

Brief description of the vacancy

Lamoda Tech в поисках Data Scientist в команду A/B Platform. Будем вместе развивать методологию A/B-тестирования, а также строить масштабируемый пайплайн расчета метрик и A/B репортов.

About the company

Lamoda Tech — IT-компания, в которой работает более 600 человек. Это разработчики, QA-инженеры, аналитики, DevOps, продуктовые менеджеры, архитекторы, дизайнеры, DS- и DE-специалисты, которые создают и развивают digital-продукты для fashion & e-commerce индустрий в России и СНГ.

Наши системы помогают быстро и гибко совершенствовать онлайн-платформу, автоматизировать финансовые и операционные процессы, работу двух складов и контакт-центров, фотостудии и службы доставки. Для этого (и не только) мы развиваем продуктовую культуру, используем микросервисную event-driven архитектуру, разрабатываем внутренний Go-инструментарий и создаем data-driven продукт.

Мы делаем цифровую революцию в fashion & e-commerce. Ищем тех, кто готов менять индустрию вместе с нами.

Responsibilities

  • Развитие методологии A/B-тестирования (снижение дисперсии, switch-back, исследование прокси-метрик);
  • Построение масштабируемого пайплайна расчета метрик и A/B репортов - конфигурирование метрик и срезов, реализация расчета и применение стат методов для оценки значимости (в связке с дата-инженером):
  • Улучшение процесса A/B-тестирования в компании - от дизайна эксперимента до валидации и принятия решения.

Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;
  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.

Requirements

  • Опыт в области анализа данных и машинного обучения (от 2 лет);
  • Опыт работы с SQL, Hadoop, Hive, Spark;
  • Владение Python, Linux, методами работы с большими данными;
  • Знания теории вероятностей и математической статистики;
  • Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
  • Знание алгоритмов и структур данных;
  • Высшее образование в области прикладной математики, информационных технологий, информатики, экономическое с уклоном в математические методы и т.п;
  • Английский язык на уровне технического чтения.

Будет плюсом:

  • Знание эконометрики;
  • Опыт работы с библиотекой statsmodels.

Working conditions

  • Гибридный или удаленный формат работы на выбор
  • ДМС со стоматологией и страхование путешествий
  • Скидка на каталог Lamoda от 15% до 40%
  • Компенсируем 15 дней больничного, чтобы не терять в зарплате

Почему у нас классно:

  • Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
  • Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
  • У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.

Contacts

Log InOnly registered users can open employer contacts.

Cookies help us deliver our services. By using our services, you agree to our use of cookies.