Кубанские Новости

Почему эффективность ИИ становится проблемой для IT-гигантов

Почему эффективность ИИ становится проблемой для IT-гигантов
Фото: freepik.com

Несмотря на критику отрасли за раздутые инвестиции и вызванный ею кризис на рынке памяти, наметились позитивные для потребителей изменения.

OpenAI закрыла убыточный видеогенератор Sora, а Google представила алгоритм TurboQuant, радикально снижающий издержки при работе нейросетей. Эти события фиксируют смену тренда: от эффектных экспериментов — к утилитарным решениям.

Закрытие Sora, которое обходилось компании примерно в $1 млн убытков ежедневно, связано с перераспределением ресурсов в пользу перспективных B2B-направлений. Конкуренция за вычислительные мощности растёт, а реальный спрос сместился в сторону ИИ-агентов для бизнеса и программирования. Показательно, что Disney, ранее заинтересованная в генерации роликов с собственными персонажами, отменила инвестиции в OpenAI на $1 млрд. Аналитики видят в этом чёткий тренд: рынок устал от бесполезных экспериментов, фокус сместился на прибыльность и практические результаты, сообщает 4pda.

Исследователи Google предложили альтернативный способ сокращения издержек. Алгоритм TurboQuant позволяет сжимать рабочую память ИИ (KV-кэш) до 3 бит без потери точности и без необходимости дообучения моделей. В бенчмарках на открытых моделях Gemma, Mistral и Llama-3.1-8B технология показала уменьшение потребляемой памяти минимум в 6 раз. Генеральный директор Cloudflare назвал это «моментом DeepSeek от Google», а рынок памяти отреагировал падением акций SK Hynix и Micron Technology — спрос на серверную ОЗУ для инференса может резко сократиться.

Парадокс заключается в том, что подобные разработки бьют по бизнес-моделям самих ИИ-гигантов. Сегодня главная преграда для запуска мощных LLM с большим контекстом на домашнем ПК — нехватка видеопамяти. Если алгоритмы экстремального сжатия станут массовыми, любой пользователь сможет запускать нейросети локально, на обычных видеокартах. Это снизит стимул оплачивать дорогие подписки и API-токены, добавив бонусы в виде приватности и отсутствия цензуры. Технологии вроде TurboQuant приближают децентрализацию искусственного интеллекта, что для многомиллиардного рынка означает потенциальные перемены: технологии станут доступнее, спрос на серверную память может снизиться, а цены на ПК-железо — нормализоваться.

Сейчас читают

Мы используем cookies для улучшения работы нашего сайта и большего удобства его использования. Продолжая использовать сайт, Вы выражаете своё согласие на обработку файлов cookies