Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Foundation Models
    • О сервисе Yandex Foundation Models
    • Мультимодальные модели
    • Эмбеддинги
    • Датасеты
    • Дообучение
    • Квоты и лимиты
  • Yandex Cloud ML SDK
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений
  1. Концепции
  2. Квоты и лимиты

Квоты и лимиты в Yandex Foundation Models

Статья создана
Yandex Cloud
Обновлена 7 мая 2025 г.

В сервисе Yandex Foundation Models действуют следующие ограничения:

  • Квоты — организационные ограничения, которые можно изменить по запросу в техническую поддержку.
  • Лимиты — технические ограничения, обусловленные особенностями архитектуры Yandex Cloud. Изменение лимитов невозможно.

Если вам необходимо больше ресурсов, отправьте запрос в техническую поддержку и расскажите, какие потребляемые квоты нужно увеличить и на сколько.

КвотыКвоты

Вид ограничения Значение
Векторизация текста
Количество запросов на векторизацию текста, в секунду 10
Генерация текста
Количество одновременных генераций в синхронном режиме, модель YandexGPT Lite 10
Количество одновременных генераций в синхронном режиме, модель YandexGPT Pro 10
Количество одновременных генераций, модель YandexGPT Pro 32k 1
Количество одновременных генераций в синхронном режиме, модель Llama 8b1 10
Количество одновременных генераций, модель Llama 70b 1
Количество запросов в секунду, асинхронный режим (запрос) 10
Количество запросов в секунду, асинхронный режим (получение ответа) 50
Количество запросов в час, асинхронный режим (запрос) 5 000
Количество запросов в секунду на токенизацию 50
Пакетный режим работы моделей
Количество запусков в час 10
Количество запусков в сутки 100
Классификация текста
Количество запросов на классификацию текста в секунду 1
Генерация изображений
Количество запросов на генерацию в минуту 500
Количество запросов на генерацию в сутки 5 000
Количество запросов результата в секунду 50
Дообучение моделей
Количество запусков дообучений в сутки 10
Количество запусков дообучений в час 3
Датасеты
Количество загруженных датасетов 100
Максимальный размер одного датасета 5 ГБ
Общий объем датасетов 300 ГБ

ЛимитыЛимиты

Вид ограничения Значение
Срок хранения результатов асинхронных запросов на сервере 3 суток
Векторизация текста
Количество токенов на вход 2 000
Размерность выходного вектора 256
Генерация текста
Максимальное количество токенов в ответе через API 2 000
Максимальное количество токенов в ответе в консоли управления 1 000
Суммарное количество токенов в запросе и ответе, модели 3 поколения 8 192
Суммарное количество токенов в запросе и ответе, модель YandexGPT Lite 4 поколения 8 192
Суммарное количество токенов в запросе и ответе, модель YandexGPT Lite 5 поколения 32 000
Суммарное количество токенов в запросе и ответе, синхронный режим модели YandexGPT Pro 4 поколения 8 192
Суммарное количество токенов в запросе и ответе, асинхронный режим модели YandexGPT Pro 4 поколения 32 000
Суммарное количество токенов в запросе и ответе, модель YandexGPT Pro 32k 32 000
Суммарное количество токенов в запросе и ответе, модель YandexGPT Pro 5 поколения 32 000
Количество бесплатных запросов в час для пользователей без платежного аккаунта. Доступно только в консоли управления 10
Ассистенты
Максимальное количество ассистентов 1 000
Максимальное количество тредов 10 000
Максимальное количество пользователей 10 000
Максимальное количество загруженных файлов 10 000
Максимальный размер файла 128 МБ
Количество файлов в одной загрузке 100
Максимальное количество файлов в поисковом индексе 10 000
Максимальное количество сообщений в одном треде 100 000
Максимальное количество поисковых индексов 1 000
Максимальное количество запущенных операций индексации 10
Генерация изображений
Максимальная длина промта 500 символов
Количество бесплатных запросов в минуту для пользователей без платежного аккаунта. Доступно только в консоли управления 2
Количество бесплатных запросов в сутки для пользователей без платежного аккаунта. Доступно только в консоли управления 10

1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.

См. такжеСм. также

  • Как начать работать с YandexGPT Lite и YandexGPT Pro
  • Как начать работать с YandexART
  • Правила тарификации для Yandex Foundation Models

Была ли статья полезна?

Предыдущая
Поисковые индексы
Следующая
Обзор
Проект Яндекса
© 2025 ООО «Яндекс.Облако»