Российские учёные почти вдвое ускорили адаптацию роботов к реальным условиям
Исследователи из Института искусственного интеллекта AIRI разработали подход, который помогает ИИ-агентам быстро подстраиваться под новые условия работы без дополнительного дообучения и остановок.
Это почти вдвое ускоряет процесс адаптации роботов к реальной среде, сообщила пресс-служба института.
Системы ИИ на основе поведенческих фундаментальных моделей умеют решать много разных задач без отдельной настройки под каждую, но плохо адаптируются к переменам внешних условий. Из-за этого существующие формы «физического ИИ» испытывают трудности при переходе от обучения в симуляции к работе в реальном мире, где параметры среды постоянно меняются и заранее неизвестны.
Российские исследователи модифицировали популярную концепцию Forward-Backward. В классическом виде алгоритм строит прогнозы возможных будущих состояний системы и путей к целям, но в нестабильной среде начинает усреднять разные варианты развития событий и из-за этого чаще ошибается, сообщает ТАСС.
Чтобы этого избежать, учёные добавили в архитектуру две модификации. Первая помогает модели по последовательности наблюдений понять, с какой средой она столкнулась. Вторая организует внутренние представления стратегий так, чтобы варианты поведения для разных условий не «смешивались» друг с другом. В итоге система ИИ лучше связывает параметры среды с действиями и переносит знания на ситуации, которых не было в обучающих данных.
Метод протестировали в задачах навигации и управления на дискретных и непрерывных средах — с изменяющейся структурой пространства и физическими параметрами. Подход сравнили с базовыми методами как в знакомых условиях, так и в новых конфигурациях, которые система ранее не видела. Качество выполнения задач выросло почти в два раза.
Как надеются учёные, разработка не только удвоит скорость адаптации роботов к незнакомой и меняющейся среде, но и позволит машинам эффективнее взаимодействовать в реальном времени с другими ИИ-агентами и людьми. Это особенно важно для работы на складах и на дорогах общего пользования, подытожил руководитель группы «Адаптивные агенты» AIRI Владислав Куренков.