Квоты и лимиты в Yandex AI Studio
Статья создана
Обновлена 22 октября 2025 г.
В сервисе Yandex AI Studio действуют следующие ограничения:
- Квоты — организационные ограничения, которые можно изменить по запросу в техническую поддержку.
- Лимиты — технические ограничения, обусловленные особенностями архитектуры Yandex Cloud. Изменение лимитов невозможно.
Если вам необходимо больше ресурсов, отправьте запрос в техническую поддержку
Квоты
| Вид ограничения | Значение |
|---|---|
| Векторизация текста | |
| Количество запросов на векторизацию текста, в секунду | 10 |
| Генерация текста | |
| Количество одновременных генераций в синхронном режиме | 10 |
| Количество запросов в секунду, асинхронный режим (запрос) | 10 |
| Количество запросов в секунду, асинхронный режим (получение ответа) | 50 |
| Количество запросов в час, асинхронный режим (запрос) | 5 000 |
| Количество запросов в секунду на токенизацию | 50 |
| Пакетный режим работы моделей | |
| Количество запусков в час | 10 |
| Количество запусков в сутки | 100 |
| Классификация текста | |
| Количество запросов на классификацию текста в секунду | 1 |
| Генерация изображений | |
| Количество запросов на генерацию в минуту | 500 |
| Количество запросов на генерацию в сутки | 5 000 |
| Количество запросов результата в секунду | 50 |
| Дообучение моделей | |
| Количество запусков дообучений в сутки | 10 |
| Количество запусков дообучений в час | 3 |
| Датасеты | |
| Количество загруженных датасетов | 100 |
| Максимальный размер одного датасета | 5 ГБ |
| Общий объем датасетов | 300 ГБ |
| MCP-серверы | |
| Количество MCP-серверов в облаке | 30 |
| Количество инструментов в одном сервере | 50 |
Голосовые агенты (модель speech-realtime-250923) |
|
| Количество одновременных сессий с моделью | 10 |
| Количество запросов на создание сессии в секунду | 10 |
Лимиты
| Вид ограничения | Значение |
|---|---|
| Срок хранения результатов асинхронных запросов на сервере | 3 суток |
| Векторизация текста | |
| Количество токенов на вход | 2 000 |
| Размерность выходного вектора | 256 |
| Генерация текста | |
| Максимальное количество токенов в ответе в консоли управления |
1 000 |
| Ассистенты | |
| Максимальное количество ассистентов | 1 000 |
| Максимальное количество тредов | 10 000 |
| Максимальное количество пользователей | 10 000 |
| Максимальное количество загруженных файлов | 10 000 |
| Максимальный размер файла | 128 МБ |
| Количество файлов в одной загрузке | 100 |
| Максимальное количество файлов в поисковом индексе | 10 000 |
| Максимальное количество сообщений в одном треде | 100 000 |
| Максимальное количество поисковых индексов | 1 000 |
| Максимальное количество запущенных операций индексации | 10 |
| Генерация изображений | |
| Максимальная длина промта | 500 символов |
| MCP-серверы | |
| Количество активных соединений в облаке на одну зону доступности | 500 |