reinforcement learningimitation learningdeep neural networksartificial intelligence
Мы ищем специалиста с высшим техническим образованием для участия в научных исследованиях. Наша команда занимается задачами обучения RL агентов с доменной адаптацией. Агенту требуется имитировать поведение эксперта на основании представленных демонстраций с учетом того, что они находятся в разных средах, их состояния и действия отличаются. Работаем с искусственными средами из gymnasium. Разработка на ML-фреймворке JAX.
AIRI - это автономная некоммерческая организация, объединяющая исследователей, ученых и инженеров, занимающихся фундаментальными исследованиями в области искусственного интеллекта.
Log InOnly registered users can open employer contacts.
Cookies help us deliver our services. By using our services, you agree to our use of cookies.