Платформа CodeRabbit опубликовала исследование State of AI vs Human Code Generation, в котором сравнила качество кода, написанного людьми и сгенерированного искусственным интеллектом.
Результаты показали, что ИИ-код в среднем в 1,7 раза уступает по качеству коду, созданному программистами. Исследование выявило системные проблемы в коде, сгенерированном нейросетями, что ставит под сомнение готовность таких инструментов к полноценному использованию в реальных проектах без серьёзного контроля со стороны человека.
В основу отчёта легли 470 реальных pull request’ов из открытых проектов на GitHub: 320 сгенерированных с помощью ИИ и 150 написанных исключительно людьми. Анализ выявил, что в ИИ-коде логические ошибки встречаются на 75% чаще, уязвимостей — в 1,5–2 раза больше, а читаемость такого кода оказалась в три раза хуже. Это может существенно замедлять процесс командной разработки и повышать риски безопасности итогового продукта.
Кроме того, ИИ-код продемонстрировал низкую производительность: в нём обнаружено почти в 8 раз больше неэффективных операций ввода-вывода, что негативно сказывается на скорости работы приложений и потреблении ресурсов.
Специалисты отмечают, что главной проблемой для ИИ становится недостаток контекста. Нейросети не имеют доступа к бизнес-правилам, архитектурным ограничениям и паттернам конкретного репозитория, из-за чего генерируют код, не учитывающий специфику проекта. Это приводит к созданию технически работоспособных, но плохо интегрируемых и часто избыточных решений, которые требуют значительной доработки опытными разработчиками. Таким образом, на текущем этапе ИИ-инструменты могут выступать лишь как вспомогательные средства, но не как полноценная замена программистов, сообщает 4PDA.