LLMRLHFRLVRRAG graphSOTA
iFORA — research-платформа анализа 850M+ документов (наука, патенты, медиа) собственная разработка НИУ ВШЭ отмечанная в журнале Nature.
Задачи: • Дообучение и исследование LLM (domain adaptation, synthetic data, RLHF/RLVR) • Reasoning, planning, AI-агенты, RAG / knowledge graph • Эксперименты, evaluation, внедрение SOTA
Требования: • 3+ лет ML/DS, research mindset • PyTorch, Transformers, multi-GPU • RL (PPO/DPO), prompt & CoT • Научные публикации большой плюс
Стек: Python, PyTorch, TRL, Axolotl, LangChain/LangGraph Инфра: A40 / A100 / H200, суперкомпьютер ВШЭ
▪️Исследование способности агентов к рассуждению и планированию (Reasoning, CoT)
▪️Полный цикл обучения до вывода модели в продакшн (Domain Adaptation и дообучение LLM с использованием внутренних и синтетических данных, создание функций оценки ответов)
▪️Разработка методов эффективного обучения и инференса
▪️Улучшение Deep Research продукта
▪️Разработка стратегий построения и обновления knowledge graph для RAG-системы
▪️NLP-задачи: Preprocessing, Classification, Summarization, NER, Semantic Search, Clustering и др
▪️Опыт работы в области ML/DS 3+ лет
▪️Высшее образование, степень: специалист / магистр / доктор наук / кандидат / PhD в области математики и компьютерных наук
▪️Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, Multi-GPU Training и оптимизация гиперпараметров
▪️Разбираетесь в RL (RLHF, RLVR), знание алгоритмов и методов preference-based optimization (PPO, DPO, GRPO)
▪️Глубокое знание современных DL/LLM-архитектур
▪️Опыт prompt engineering и chain-of-thought reasoning для LLM
▪️Опыт работы с Pytorch, ONNX, Nvidia TensorRT, CUDA, Docker
▪️Знание методов оптимизации и ускорения инференса нейронных сетей
▪️Умеете превращать научные статьи в код: реализовывали SOTA-методы и алгоритмы
▪️Способность вести учет экспериментов (файлы с метриками, s3, MLFlow, W&B)
▪️Знание средств командной разработки - Chat, Kanban, Wiki, Mail
▪️Базовые знания Linux, Git, Bash и Docker
Будет плюсом:
▪️Наличие научных публикаций
▪️Опыт разработки ИИ-агентов (ReAct, Multi-Agent)
▪️Опыт в LangChain, LangGraph для построения multi-agent систем (MAS) RAG-систем или AI-агентов
▪️Интересная работа и масштабный проект
▪️Кластер с GPU A40, A100, H200 для прототипирования
▪️Доступ к суперкомпьютеру НИУ ВШЭ «cHARISMa»
▪️Обучение (семинары, курсы, тренинги от НИУ ВШЭ, английский)
▪️График работы: гибрид (возможна удалёнка), гибкое время начало дня с 8.00 до 11.00
▪️Программы лояльности от крупнейших фитнес-клубов и театров Москвы
▪️ДМС
▪️Доступ к регулярно обновляющейся библиотеке НИУ ВШЭ, а также электронным и аудиокнигам издательства «МИФ»
▪️Офис в шаговой доступности от лучших кофеен и книжных Москвы на Мясницкой (м. Лубянка / м. Тургеневская), скидки в «Даблби», «Ska vi fi ka?» и «Буквышка» при предъявлении пропуска НИУ ВШЭ
Log InOnly registered users can open employer contacts.
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy