Deep Reinforcement Learning

Изучаются алгоритмы обучения с подкреплением, использующие нейронные сети.

neuralnetworksreinforcement learning

Описание

Курс посвящен методам обучения с подкреплением (Reinforcement learning) - одному из способов машинного обучения. В нем рассматривается задача о построении систем (агентов), которые могли бы приспосабливаться к окружающей среде, обучаться действовать оптимально на основе получаемого опыта. Такие задачи возникают во многих областях, включая информатику, технические науки, математику, физику, нейробиологию и когнитологию. В начале 2010-х годов методы обучения с подкреплением были применены для обучения агентов, действия которых определяются нейронными сетями. Это позволило получить ряд прорывных результатов, сильно продвинувших понимание границ искусственного интеллекта (игры Atari, Go, StarCraft 2). В рамках данного курса излагаются основные методы обучения с подкреплением, приводятся техники их успешного использования для обучения агентов оснащенных нейронными сетями, рассматриваются примеры. 

Требования

Для успешного освоения материалов курса желательно знать основы теории вероятностей и хорошо владеть языком Pyhton.

Структура

Курс содержит 6 лекций и 6 практических занятий. После каждого практического занятия выдается домашняя работа, которую нужно выполнить за 3 недели.

Лектор

Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy