Hidden
NLP Engineer

Moscow
RUB 250,000300,000/month
Remote or office
Full-time

NLP

Moderation Review

In the archive

Brief description of the vacancy

Мы ищем NLP Engineer уровня Middle или Senior для разработки и оптимизации NLP-пайплайнов. Ваша основная задача будет связана с настройкой и дообучением крупных языковых моделей (GPT, BERT и другие), решением классических задач NLP и внедрением моделей в продакшн. Необходим опыт работы с Python, основными NLP-библиотеками, контейнеризацией и облачными сервисами.

About the company

Company Алроса

Алроса - крупнейшая алмазодобывающая компания в мире. Департмаент исследования данных занимается внедрением и разработкой цифровых решений во всех сферах добычи: от геологии до сбыта.

Responsibilities

  • Разработка и оптимизация NLP пайплайнов для обработки текстовых данных.
  • Решение классических задач NLP: классификация текста, извлечение сущностей, сентимент-анализ, токенизация, машинный перевод и другие.
  • Работа с крупными языковыми моделями (LLM), настройка, дообучение и интеграция моделей GPT, BERT и других.
  • Оптимизация и внедрение NLP моделей в продакшн.
  • Взаимодействие с командами DS для интеграции и поддержки их решений в области NLP.
  • Расширение стека технологий NLP внутри компании с применением SOTA подходов.

Стек:

  • Hugging Face, PyTorch, TensorFlow, spaCy, NLTK, Transformers, FastAPI, Docker, Kubernetes, Airflow, Git, Postgres, S3, Kafka.
  • Работа с LLM (GPT, BERT и т.д.), а также с API крупных моделей.

Requirements

  • Опыт работы с NLP задачами (токенизация, классификация, извлечение сущностей и т.д.).
  • Опыт работы с крупными языковыми моделями (LLM) и их адаптация под нужды компании.
  • Уверенные знания Python и основных NLP-библиотек (Transformers, spaCy, NLTK).
  • Опыт работы с контейнеризацией (Docker, Kubernetes).
  • Опыт работы с облачными сервисами и базами данных (Postgres, S3).

Будет плюсом:

  • Опыт построения RAG систем.
  • Опыт работы с моделями машинного перевода и генеративными моделями.
  • Опыт работы с CI/CD пайплайнами для NLP проектов.
  • Знание систем обработки данных в реальном времени (Kafka, Spark).
  • Навыки работы с API для интеграции моделей.

Working conditions

  • ДМС со стоматологией

Contacts

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy