Ended 14 months ago
24 participants
14 submissions

DRL Course Домашнее задание 6

Задания по шестой лекции и шестому практическому занятию

После лекции 6 и практического занятия 6 требуется выполнить одно задание:

  • Найти лучшие гиперпараметры для DDPG в двух средах: Pendulum-v1 и MountainCarContinuous-v0. Сравнить результаты с DeepCrossEntropy.

Оформление

Код задания следует выполнить в .py файле с названием "(фамилия)_practice6_1.py". Результаты всех исследований следует оформить в отчет в виде одного .pdf файла с названием "(фамилия)_practice6.pdf". Отчеты оформляются в произвольной форме, однако должны содержать  

  • оглавление,
  • описание экспериментов,
  • результаты экспериментов проиллюстрированные в виде графиков обучения (ось x - количество итераций обучения, ось y - результаты обучения),
  • вывод.

Все файлы кладутся в папку с названием "(фамилия)_practice6" и предоставляется возможность скачать эту папке по ссылке (google.drive, yandex.disk и пр.). Задания отправляются в форме ниже в формате:

Фамилия Имя Отчество

Домашняя работа 6 - (ссылка на папку (фамилия)_practice6)

Оценка

Выполнение заданий оценивается в 10 баллов - 5 баллов на правильность выполнения и 5 за качество оформление отчета.

Cookies help us deliver our services. By using our services, you agree to our use of cookies.