Hidden
Junior/Middle Data Scientist (NLP)

Created:
RUB 150,000350,000/month
Remote or office
Full-time

NLPLLMText-classificationText-clustering

Moderation Review

In the archive

Brief description of the vacancy

В расположении РЦНИ находятся данные по мировым публикациям, проектам, патентам. Для обработки этих данных с целью представления их экспертам и федеральным центрам необходимо обучать классификаторы, выделять кластеры, создавать рекомендательные системы. В связи с этим мы находимся в поиске сотрудника, которому близки эти задачи.

About the company

Company Федеральное государственное бюджетное учреждение «Российский центр научной информации»

Федеральное государственное бюджетное учреждение «Российский центр научной информации» (далее - РЦНИ) . Основными направлениями деятельности РЦНИ являются:

  • обеспечение работы с данными сферы исследований и разработок;
  • выполнение функций оператора "Белого списка" журналов, созданного в целях обеспечения мониторинга и оценки публикационной активности научных и образовательных организаций, научных и научно-педагогических кадров;
  • реализация экспертных услуг с организациями, осуществляющими научную и научно-техническую деятельность.

Responsibilities

  • Решение классических задач NLP;
  • обучение моделей, включая обучение моделей с нуля и дообучение SOTA моделей;
  • Поддержка и улучшение существующих моделей;
  • Написание эффективного и читаемого Python кода и документации к нему.

Requirements

  • Опыт работы с NLP задачами (классификация, извлечение сущностей и т.д.);
  • Уверенные знания Python NLP-библиотек ( spaCy, NLTK, Natasha, Gensim, scikit-learn, Regex, AllenNLP, flair);
  • Опыт работы c DL библиотеками (Hugging Face, PyTorch, Transformers);
  • Опыт работы с крупными языковыми моделями (LLM, RAG, LLaMA-Factory);
  • Опыт работы с базами данных и системами контроля версий (Postgres, GIT) .

Будет плюсом:

  • Умение находить и предлагать новые решения;
  • Опыт работы с векторными базами данных и поисковыми индексами;
  • Опыт работы с рекомендательными системами.

Working conditions

  • Гибкий гибридный формат работы в Москве;
  • Оформление в соответствии с ТК РФ, официальная заработная плата;
  • Участие в интересных проектах;
  • Мощный GPU сервер.

Contacts

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy