Junior/Middle Data Scientist (NLP)

RUB 150,000350,000/month
Remote or office
Full-time

NLPLLMText-classificationText-clustering

Brief description of the vacancy

В расположении РЦНИ находятся данные по мировым публикациям, проектам, патентам. Для обработки этих данных с целью представления их экспертам и федеральным центрам необходимо обучать классификаторы, выделять кластеры, создавать рекомендательные системы. В связи с этим мы находимся в поиске сотрудника, которому близки эти задачи.

About the company

Company Федеральное государственное бюджетное учреждение «Российский центр научной информации»

Федеральное государственное бюджетное учреждение «Российский центр научной информации» (далее - РЦНИ) . Основными направлениями деятельности РЦНИ являются:

  • обеспечение работы с данными сферы исследований и разработок;
  • выполнение функций оператора "Белого списка" журналов, созданного в целях обеспечения мониторинга и оценки публикационной активности научных и образовательных организаций, научных и научно-педагогических кадров;
  • реализация экспертных услуг с организациями, осуществляющими научную и научно-техническую деятельность.

Responsibilities

  • Решение классических задач NLP;
  • обучение моделей, включая обучение моделей с нуля и дообучение SOTA моделей;
  • Поддержка и улучшение существующих моделей;
  • Написание эффективного и читаемого Python кода и документации к нему.

Requirements

  • Опыт работы с NLP задачами (классификация, извлечение сущностей и т.д.);
  • Уверенные знания Python NLP-библиотек ( spaCy, NLTK, Natasha, Gensim, scikit-learn, Regex, AllenNLP, flair);
  • Опыт работы c DL библиотеками (Hugging Face, PyTorch, Transformers);
  • Опыт работы с крупными языковыми моделями (LLM, RAG, LLaMA-Factory);
  • Опыт работы с базами данных и системами контроля версий (Postgres, GIT) .

Будет плюсом:

  • Умение находить и предлагать новые решения;
  • Опыт работы с векторными базами данных и поисковыми индексами;
  • Опыт работы с рекомендательными системами.

Working conditions

  • Гибкий гибридный формат работы в Москве;
  • Оформление в соответствии с ТК РФ, официальная заработная плата;
  • Участие в интересных проектах;
  • Мощный GPU сервер.

Contacts

Log InOnly registered users can open employer contacts.

Cookies help us deliver our services. By using our services, you agree to our use of cookies.