Senior Data Scientist (LLM)

RUB 350,000450,000/month
Remote or office
Full-time

LLM NLP PyTorch PySpark

Brief description of the vacancy

Мы в поиске Senior Data Scientist в команду, занимающуюся применением DL подходов в задачах Lamoda. Наша цель – с помощью глубокого обучения научиться понимать стиль, сходство, атрибуты одежды, а также предпочтения миллионов пользователей. Помимо этого мы активно развиваем применения LLM в различных задачах Lamoda от клиентских продуктов до поддержки и умного поиска по внутренним системам.

About the company

Company Lamoda Tech

Команда Lamoda Tech совершает цифровую революцию в fashion и e-commerce: разрабатывает ML-решения для каталога из сотен тысяч товаров, автоматизирует распределительные центры, по всему СНГ налаживает систему доставки и движение курьеров так, чтобы клиент мог получить заказ в течение выбранных 15 минут.

Мы ищем тех, кто с удовольствием пробует новое, не боится спросить совета у коллег и сам готов делиться опытом.

Responsibilities

  • Обучение LLM-стилиста, разбирающегося в моде и стиле, который способен поддерживать диалог, давать советы и помогать в навигации по товарам на Lamoda
  • Проведение полного цикла дообучения LLM: Continual pretraining, SFT, Preference Optimization этапы
  • Развитие RAG пайпланов: полнотекстовый, семантический и гибридный поиск документов в базе знаний
  • Разработка retrieval алгоритмов в различных задачах: визуальный поиск, поиск релеватного документа, поиск подходящего товара/образа
  • Выстраивание связи между LLM-стилистом и моделями генерации образов (комлектов товаров)
  • Разработка внутренних бенчмарков для оценки языковых моделей, включая llm as judge подходы

Requirements

  • Опыт работы в ML от 5 лет, в Deep Learning от 3 лет
  • Владение Python и умение писать сложные SQL-запросы, опыт работы с Hadoop, Spark, Airflow, Docker
  • Опыт дообучения LLM, построения агентских систем / RAG-пайплайнов
  • Опыт вывода ML-моделей в прод для решения бизнес-задач
  • Знания математической статистики, теории вероятности, алгоритмов и структур данных

Working conditions

  • Мы аккредитованная IT-компания
  • Есть возможность работать по "гибриду" из Москвы, либо удалённо из любой точки РФ
  • Всё необходимое железо для работы: мощные ресерч-сервера с GPU и большой Hadoop-кластер
  • Зрелый сетап разработки ML-решений полного цикла: современный стек, высокий уровень культуры разработки, более 50 ML-моделей в проде, есть команда MLOps
  • Полный жизненный цикл разработки data-driven продуктов с применением ML - от генерации идеи и до подведения результатов АБ-теста
  • Проекты НЕ в стол, более 95% инициатив доходят до A/b теста/прода (можно видеть результаты своей работы буквально с первого квартала; хороший time-to-market)
  • Культура code review и принятия решений на основании данных
  • Сильные кросс-функциональные команды middle и senior специалистов, развитое DS-сообщество, любим обмениваться знаниями на внутренних шерингах и митапах
  • Можно и нужно предлагать свои идеи; каждый может влиять на то, что делается в рамках его команды или всего DS-отдела/продукта
  • Персональные карьерные маршруты для каждого члена DS команды
  • Минимум бюрократии, доступы за 1-2 дня

Contacts

Log InOnly registered users can open employer contacts.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy