Автор на курс «Обучение с подкреплением — Reinforcement Learning»

from RUB 50,000/month
Remote
Part-time

#RL #Reinforcement Learning #PyTorch #ML

Brief description of the vacancy

Яндекс Практикум расширяет линейку курсов по ML&AI и ищет на парт-тайм специалистов с опытомпрактического применения RL в коммерческих или исследовательских задачах от 2-х лет, которые создадут контент для нового продукта в роли автора курса.

About the company

Company Яндекс Практикум

Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца.

Responsibilities

  • Создавать материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продакт‑менеджерами программы.
  • Писать тексты уроков, в которых поддерживает интерес студентов к обучению.
  • Улучшать существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов.
  • Разрабатывать дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний.
  • Предлагать идеи, как улучшить усвоение материала.
  • Участвовать в проектировании программы.

Requirements

    • Знания классических методов RL: MDP, POMDP, value-based и policy-based подходы, уравнения Беллмана, стратегии исследования.
  • Опыт работы с Deep Reinforcement Learning: DQN, Policy Gradient, Actor-Critic, PPO и смежные алгоритмы.
  • Опыт реализации RL-систем: построение агента, буфера опыта, TD-обновлений, сетевых архитектур и обучающего контура.
  • Понимание продвинутых методов поведения: curiosity-driven подходы, RND/ICM, model-based RL, планирование, многоагентные системы.
  • Опыт работы с PyTorch: построение и обучение нейросетевых моделей, реализация policy/value-сетей, оптимизация.
  • Практический опыт работы с RL-средами: OpenAI Gym/Gymnasium, PettingZoo, custom environments.
  • Понимание продакшен-сервисов: API, Docker, логирование, мониторинг.
  • “Боевой” опыт ведения типового ML проекта: проектирование пайплайнов, версионирование, работа с экспериментами, дебагинг.

Будет преимуществом

  • Опыт применения RL в более, чем одной сфере: робототехнике, симуляторах, играх, рекомендательных системах или других.
  • Опыт менторства, написания статей или образовательного контента на темы RL.

Working conditions

  • Вознаграждение за один урок — 10 000 рублей. При минимальной нагрузке ежемесячное вознаграждение составляет от 50 000 рублей. Можно совмещать с основной работой (от 10 часов в неделю)
  • Мы предлагаем удаленное сотрудничество, нужно только быть на связи в мессенджерах и иногда в Zoom.
  • Возможность экспериментировать и реализовать свой потенциал: мы доверяем вашему опыту и не тратим время и силы друг друга на микроменеджмент.
  • Плавное погружение в сотрудничество: познакомим вас с инструментами разработки курсов и с командой, которая поможет преобразовать ваши знания в целый курс.
  • Пополнение портфолио: мы выдаем нашим экспертам сертификаты о социально-полезной деятельности.
  • Нетворкинг, поддержка и вдохновение от комьюнити экспертов из разных сфер.
  • Возможность писать статьи и участвовать в конференциях, мероприятиях и подкастах Яндекс-Практикума.

Contacts

Log InOnly registered users can open employer contacts.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy