Hidden
Senior Data Scientist (Ranking&Search)

Created:
Remote or office
Full-time

MLData ScientistRankingSearchFashion AI

Moderation Review

In the archive

Brief description of the vacancy

Команда Data Science в Lamoda Tech в поисках Senior Data Scientist (Ranking&Search). Будем вместе развивать модели ранжирования товаров в каталоге Lamoda и улучшать алгоритмы поиска в направлении fashion & lifestyle.

About the company

Company Lamoda Tech

Lamoda Tech — IT-компания, в которой работает более 600 человек. Это разработчики, QA-инженеры, аналитики, DevOps, продуктовые менеджеры, архитекторы, дизайнеры, DS- и DE-специалисты, которые создают и развивают digital-продукты для fashion & e-commerce индустрий в России и СНГ.

Наши системы помогают быстро и гибко совершенствовать онлайн-платформу, автоматизировать финансовые и операционные процессы, работу двух складов и контакт-центров, фотостудии и службы доставки. Для этого (и не только) мы развиваем продуктовую культуру, используем микросервисную event-driven архитектуру, разрабатываем внутренний Go-инструментарий и создаем data-driven продукт.

Мы делаем цифровую революцию в fashion & e-commerce. Ищем тех, кто готов менять индустрию вместе с нами.

Responsibilities

  • Развивать модели ранжирования товаров в каталоге/поиске с помощью: персонализации каталога/поиска, добавления онлайн факторов по текущей сессии, адаптации ранжирования для новых пользователей и развития алгоритмов генерации кандидатов;
  • Улучшать алгоритмы поиска, в том числе с использованием нейронных сетей.

Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;
  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.

Requirements

  • Опыт в области анализа данных и машинного обучения (от 2 лет);
  • Опыт работы с SQL, Hadoop, Hive, Spark;
  • Владение Python, Linux, методами работы с большими данными;
  • Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML;
  • Знания теории вероятностей и математической статистики;
  • Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
  • Знание алгоритмов и структур данных;
  • Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
  • Английский язык на уровне технического чтения и профессионального общения.

Working conditions

  • Гибридный или удаленный формат работы на выбор
  • ДМС со стоматологией и страхование путешествий
  • Скидка на каталог Lamoda от 15% до 40%
  • Компенсируем 15 дней больничного, чтобы не терять в зарплате

Почему у нас классно:

  • Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
  • Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
  • У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.

Contacts

Cookies help us deliver our services. By using our services, you agree to our use of cookies.