Hidden
NLP Engineer

RUB 250,000300,000/month
Remote or office
Full-time

NLP

Moderation Review

In the archive

Brief description of the vacancy

Мы ищем NLP Engineer уровня Middle или Senior для разработки и оптимизации NLP-пайплайнов. Ваша основная задача будет связана с настройкой и дообучением крупных языковых моделей (GPT, BERT и другие), решением классических задач NLP и внедрением моделей в продакшн. Необходим опыт работы с Python, основными NLP-библиотеками, контейнеризацией и облачными сервисами.

About the company

Company Алроса

Алроса - крупнейшая алмазодобывающая компания в мире. Департмаент исследования данных занимается внедрением и разработкой цифровых решений во всех сферах добычи: от геологии до сбыта.

Responsibilities

  • Разработка и оптимизация NLP пайплайнов для обработки текстовых данных.
  • Решение классических задач NLP: классификация текста, извлечение сущностей, сентимент-анализ, токенизация, машинный перевод и другие.
  • Работа с крупными языковыми моделями (LLM), настройка, дообучение и интеграция моделей GPT, BERT и других.
  • Оптимизация и внедрение NLP моделей в продакшн.
  • Взаимодействие с командами DS для интеграции и поддержки их решений в области NLP.
  • Расширение стека технологий NLP внутри компании с применением SOTA подходов.

Стек:

  • Hugging Face, PyTorch, TensorFlow, spaCy, NLTK, Transformers, FastAPI, Docker, Kubernetes, Airflow, Git, Postgres, S3, Kafka.
  • Работа с LLM (GPT, BERT и т.д.), а также с API крупных моделей.

Requirements

  • Опыт работы с NLP задачами (токенизация, классификация, извлечение сущностей и т.д.).
  • Опыт работы с крупными языковыми моделями (LLM) и их адаптация под нужды компании.
  • Уверенные знания Python и основных NLP-библиотек (Transformers, spaCy, NLTK).
  • Опыт работы с контейнеризацией (Docker, Kubernetes).
  • Опыт работы с облачными сервисами и базами данных (Postgres, S3).

Будет плюсом:

  • Опыт построения RAG систем.
  • Опыт работы с моделями машинного перевода и генеративными моделями.
  • Опыт работы с CI/CD пайплайнами для NLP проектов.
  • Знание систем обработки данных в реальном времени (Kafka, Spark).
  • Навыки работы с API для интеграции моделей.

Working conditions

  • ДМС со стоматологией

Contacts

Cookies help us deliver our services. By using our services, you agree to our use of cookies.