Изучаются алгоритмы обучения с подкреплением, использующие нейронные сети.
neuralnetworksreinforcement learning
Курс посвящен методам обучения с подкреплением (Reinforcement learning) - одному из способов машинного обучения. В нем рассматривается задача о построении систем (агентов), которые могли бы приспосабливаться к окружающей среде, обучаться действовать оптимально на основе получаемого опыта. Такие задачи возникают во многих областях, включая информатику, технические науки, математику, физику, нейробиологию и когнитологию. В начале 2010-х годов методы обучения с подкреплением были применены для обучения агентов, действия которых определяются нейронными сетями. Это позволило получить ряд прорывных результатов, сильно продвинувших понимание границ искусственного интеллекта (игры Atari, Go, StarCraft 2). В рамках данного курса излагаются основные методы обучения с подкреплением, приводятся техники их успешного использования для обучения агентов оснащенных нейронными сетями, рассматриваются примеры.
Для успешного освоения материалов курса желательно знать основы теории вероятностей и хорошо владеть языком Pyhton.
Курс содержит 8 лекций и 8 практических занятий. После каждого практического занятия выдается домашняя работа, которую нужно выполнить за 3 недели.
Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.
Книги
Cookies help us deliver our services. By using our services, you agree to our use of cookies.