Общество

На ПМЭФ представили новое поколение экономичных моделей искусственного интеллекта

Фото: magnific.com

Российские учёные показали на Петербургском международном экономическом форуме семейство компактных моделей ИИ, которые способны выполнять роль когнитивного ядра и взаимодействовать с внешними инструментами, базами данных и поисковыми системами.

При этом они не требуют больших вычислительных мощностей. Об этом ТАСС сообщила пресс‑служба Института искусственного интеллекта AIRI.

Генеральный директор AIRI Иван Оселедец заявил, что для большинства прикладных задач важнее не объём памяти модели, а её способность рассуждать и опираться на предоставленные данные. По его словам, представленный проект — это попытка построить именно такое когнитивное ядро. Это важный шаг к будущему, в котором небольшие модели будут эффективно взаимодействовать с инструментами, а не пытаться хранить весь мир внутри своих параметров.

Как объясняют исследователи, большинство существующих больших языковых моделей развиваются экстенсивным путём. Каждое новое поколение содержит всё больше параметров и хранит огромный объём знаний непосредственно во внутренних весах модели. Такой подход позволяет отвечать практически на любые вопросы, но делает системы дорогими в обучении и эксплуатации, а также заставляет ИИ чрезмерно полагаться на свои знания и игнорировать внешние источники информации.

Специалисты AIRI при поддержке Сбера предложили принципиально другой подход к разработке систем ИИ, который получил название Optimal Cognitive Core. В соответствии с этим подходом нейросеть представляет собой компактное когнитивное ядро, сосредоточенное не на хранении знаний, а на способности анализировать информацию, строить логические связи между фактами и корректно работать с внешними источниками данных.

Как показали опыты, построенная на базе этого подхода система ИИ, умеющая использовать внешние данные, обрабатывает запросы в полтора‑два раза быстрее решений, которые используют большие языковые модели, и тратит на это в полтора раза меньше вычислительных ресурсов. Благодаря небольшим размерам такую систему можно запускать на обычном ноутбуке или смартфоне.

Разработка уже выложена в открытый доступ. Её можно использовать в финансовых сервисах, корпоративных базах знаний, клиентской поддержке, а также в юридических и медицинских системах, где критически важно отвечать строго по документам и избегать ошибок.