Искусственный интеллект с каждым годом потребляет всё больше электроэнергии, что оказывает влияние не только на экономику, но и на экологию, поэтому учёные активно ищут способы повышения энергоэффективности дата-центров.
По оценке Международного энергетического агентства, в 2024 году ИИ-системы и центры обработки данных в США потребили около 415 тераватт-часов электроэнергии — это больше 10 процентов от всего электричества, выработанного в стране, а к 2030 году этот спрос может вырасти вдвое. На этом фоне особенно важны технологии, которые позволят сделать ИИ не только умнее, но и экономичнее, и именно такой подход недавно предложили специалисты инженерной школы под руководством Маттиаса Шойца, сообщает Hi-Tech Mail.
Учёные создали экспериментальную систему, которая может снизить энергопотребление ИИ почти в 100 раз и при этом точнее решать практические задачи. Вместо привычных больших языковых моделей, таких как ChatGPT, исследователи сосредоточились на системах для роботов — так называемых visual-language-action models, или VLA. Такие модели одновременно видят изображение с камеры, понимают текстовые команды и превращают это в действие: например, заставляют робота взять предмет, передвинуть его или собрать конструкцию. Проблема в том, что обычные VLA, как и большие языковые модели, в основном полагаются на статистические закономерности и обучение на огромных массивах данных, что делает их очень прожорливыми в плане энергии и при этом не всегда надёжными.
Если языковая модель может «выдумать» судебные дела, придумать несуществующие научные статьи или нарисовать человека с шестью пальцами, то VLA может, например, перепутать тень с краем кубика, и тогда робот поставит деталь неправильно. Чтобы исправить этот недостаток, учёные использовали гибридный подход — так называемый нейро-символический ИИ, который сочетает нейросети с логическими правилами, то есть с набором правил и абстрактных понятий вроде формы, устойчивости и правильной последовательности действий. По сути, система учится не просто узнавать картинки, а «думать по шагам».
Как объясняет Маттиас Шойц, большие языковые модели и VLA часто опираются на статистику из больших обучающих наборов, а это может приводить к ошибкам, тогда как нейро-символическая система может применять правила, которые сокращают количество проб и ошибок и гораздо быстрее приводят к решению. В тестах на классической задаче «Ханойская башня», где нужно точно планировать ходы, новая система показала 95 процентов успеха против 34 процентов у стандартных моделей. На более сложной версии задачи, с которой она раньше не сталкивалась, гибридная модель справилась в 78 процентах случаев, тогда как обычные модели провалили все попытки. Обучение заняло всего 34 минуты вместо полутора суток, а затраты энергии на обучение составили лишь один процент от обычного уровня. Во время работы система потребляла около пяти процентов энергии по сравнению с обычными моделями.
По мнению авторов исследования, будущее искусственного интеллекта, особенно в робототехнике, может быть не за бесконечным наращиванием вычислительных мощностей, а за более «разумными» архитектурами, которые умеют сочетать обучение с логикой.