Deep Reinforcement Learning

Изучаются алгоритмы обучения с подкреплением, использующие нейронные сети.

neuralnetworksreinforcement learning

Описание

Курс посвящен методам обучения с подкреплением (Reinforcement learning) - одному из способов машинного обучения. В нем рассматривается задача о построении систем (агентов), которые могли бы приспосабливаться к окружающей среде, обучаться действовать оптимально на основе получаемого опыта. Такие задачи возникают во многих областях, включая информатику, технические науки, математику, физику, нейробиологию и когнитологию. В начале 2010-х годов методы обучения с подкреплением были применены для обучения агентов, действия которых определяются нейронными сетями. Это позволило получить ряд прорывных результатов, сильно продвинувших понимание границ искусственного интеллекта (игры Atari, Go, StarCraft 2). В рамках данного курса излагаются основные методы обучения с подкреплением, приводятся техники их успешного использования для обучения агентов оснащенных нейронными сетями, рассматриваются примеры. 

Требования

Для успешного освоения материалов курса желательно знать основы теории вероятностей и хорошо владеть языком Pyhton.

Структура

Курс содержит 6 лекций и 6 практических занятий. После каждого практического занятия выдается домашняя работа, которую нужно выполнить за 3 недели.

Лектор

Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.

Автор курса

Track program

Cookies help us deliver our services. By using our services, you agree to our use of cookies.