RL Инженер

from RUB 200,000/month
Remote or office
Full-time

RL Robotics

Brief description of the vacancy

Центр когнитивного моделирования ИИИ МФТИ в поисках RL инженера для проекта, связанного с автоматизацией манипуляционных операций в сложной и вариативной среде, включающих работу с множеством объектов различной формы и свойств.

About the company

Company Институт искусственного интеллекта МФТИ

Центр когнитивного моделирования Института ИИ МФТИ — одна из ведущих российских научно-инженерных групп в области робототехники, ИИ и когнитивных систем. Мы разрабатываем прикладные и исследовательские решения в сфере манипуляции, автономных робототехнических систем и управления сложными объектами. Результаты регулярно публикуются в ведущих журналах (Neurocomputing, RA-L, EAAI, IEEE Transactions on ITS и др.) и на международных конференциях (ICRA, IROS, CoRL, ICCV и т.д.).

Responsibilities

  • Разработка алгоритмов RL, в т.ч.:
  • проектирование, реализация и оптимизация алгоритмов обучения с подкреплением (PPO, SAC, TD3 и др.)
  • создание обучающих пайплайнов для online и offline RL: генерация траекторий, формирование и анализ Replay Buffer
  • разработка инструментов мониторинга экспериментов, анализа поведения политик и управления качеством данных. • Работа с симуляцией (IsaacSim):
  • построение физически реалистичных симуляций объектов и манипуляторов, включая настройку параметров массы, трения, инерции, контактов
  • генерация обучающих данных с использованием домен-рандомизации и крупных наборов 3D-моделей.
  • разработка и интеграция кастомных симуляционных сред для RL-обучения. • Работа с реальными роботами:
  • адаптация и отладка политик на реальном манипуляторе
  • дообучение моделей на реальных данных (Sim2Real adaptation)
  • анализ ошибок и повышение устойчивости поведения при переносе «симуляция-реальность». • Интеграция управления:
  • реализация архитектуры «RL+классическое управление» (PID, MPC, LQR и др.)
  • интеграция компонентов в ROS-пайплайны и системные модули управления роботом. • Инженерные задачи и разработка инструментов:
  • написание чистого, поддерживаемого кода (ООП, документация, тестирование)
  • участие в разработке архитектуры внутренних библиотек и инфраструктуры
  • оптимизация вычислительных пайплайнов, ускорение симуляционных циклов.

Requirements

• Обязательное наличие оконченного высшего технического образования. • Уверенное владение языком Python, желательный опыт промышленной разработки • Опыт работы с фреймворком PyTorch • Наличие практического опыта разработки алгоритмов RL (PPO, SAC, TD3 и др.) • Опыт подготовки данных для Offline RL • Базовые навыки компьютерного зрения в задачах управления и манипуляции (работа с RGB/RGB-D, выделение объектов, простые модели восприятия) • Понимание кинематики и динамики манипуляторов • Опыт разработки собственных сред или сценариев в симуляции.

Working conditions

  • Оформление в соответствии с ТК РФ;
  • Конкурентная заработная плата;
  • Профессиональное развитие, участие в международных проектах;
  • Возможность активно участвовать в жизни МФТИ, посещать различные мероприятия, тренинги, семинары;
  • Дружный и профессиональный коллектив единомышленников и передовых ученых в сфере AI;
  • Отсрочка от армии;
  • Возможность бесплатного посещения бассейна и тренажерного зала;
  • В соответствии с ТК РФ работники сферы образования обязаны предоставить справку о наличии (отсутствии) судимости и (или) факта уголовного преследования, срок изготовления которой может быть до 30 дней, просим заранее позаботиться о её получении.

Contacts

Log InOnly registered users can open employer contacts.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy