Клиенты Yandex AI Studio увеличили потребление генеративных нейросетей в облаке в пять раз

С начала 2025 года ежедневное потребление нейросетей в облачной инфраструктуре выросло более чем в пять раз, суммарно клиенты используют десятки миллиардов токенов в месяц.

Рост интереса к генеративным моделям связан с тем, что сценариев реального применения нейросетей с ощутимым бизнес‑эффектом стало больше, а AI‑ассистентов и другие решения на базе искусственного интеллекта теперь можно быстро создать и внедрить в любой компании с помощью специальных инструментов.

Полноэкранное изображение

В сентябре годовой повторяющийся доход (ARR) от облачного потребления Yandex AI Studio превысил 1,2 млрд рублей.

На платформе Yandex AI Studio доступно более 20 развёрнутых в облаке моделей в разных режимах работы. Самыми популярными по потреблению остаются модели семейства YandexGPT — на них приходится 62,7% от общего трафика на облачной платформе. Такой высокий спрос позволил снизить цены на собственные модели компании, сделав их более доступными. На втором и третьем местах — опенсорсные модели Qwen3‑235b от Alibaba Group (30,9%) и GPT‑OSS от OpenAI (5,7%).

Полноэкранное изображение

Чаще всего модели YandexGPT используют для RAG‑сценариев с поиском информации и генерации ответов по документам, таблицам и изображениям, а также для пересказа больших объёмов информации и выделения ключевых тезисов. Среди основных сценариев применения Qwen3‑235b — создание агентских систем, которые могут работать с внешними приложениями, и написание кода по запросу.

Количество пользователей платформы Yandex AI Studio к сентябрю 2025 года достигло 40 тыс. клиентов, почти половина из них — крупный бизнес. Например, с помощью нейросети Лемана Про снизила стоимость написания карточек товаров на сайте более чем на 95%. «Ренессанс Жизнь» ускорила обработку документов от государственных организаций в десятки раз — теперь этот процесс занимает 20–30 секунд. Чат‑бот от Банки.ру помогает пользователям быстрее находить подходящие финансовые решения. ИИ‑ассистент доступен 20 млн человек и уже отвечает на 20% популярных запросов пользователей, постепенно расширяя круг тем, по которым он может давать консультации.

Мы активно инвестируем в развитие облачного ML‑рынка в России: помимо самих нейросетей мы также предлагаем RAG‑инструменты для поиска по интернету, документам и базам знаний, возможность быстрого создания текстовых и голосовых AI‑агентов без написания кода и их быстрого подключения к сервисам партнёров по MCP‑протоколу. Всё это позволяет компаниям автоматизировать корпоративные процессы и рутинные бизнес‑задачи сотрудников.

Помимо облачной инфраструктуры, компании также могут использовать модели и инструменты Yandex AI Studio на собственной инфраструктуре. Это можно сделать самостоятельно или с помощью Yandex Cloud Stackland — в таком случае развёртывание и интеграция займет меньше времени и ресурсов.

author
Артур Самигуллин
Руководитель платформы Yandex AI Studio
Клиенты Yandex AI Studio увеличили потребление генеративных нейросетей в облаке в пять раз
Войдите, чтобы сохранить пост