Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ML Services
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex AI Studio
    • О сервисе Yandex AI Studio
      • Обзор
      • Модели базового инстанса
      • Модели выделенного инстанса
      • Пакетная обработка данных
      • Вызов функций
      • Режим рассуждений
      • Форматирование ответов моделей
      • Эмбеддинги
      • Датасеты
      • Дообучение
      • Токены
    • Yandex Workflows
    • Квоты и лимиты
    • Термины и определения
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений

В этой статье:

  • Жизненный цикл модели
  • Обращение к моделям
  1. Концепции
  2. Model Gallery
  3. Модели базового инстанса

Модели базового инстанса

Статья создана
Yandex Cloud
Обновлена 2 октября 2025 г.
  • Жизненный цикл модели
  • Обращение к моделям

Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.

В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.

Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. При обновлении моделей поколения, доступные в разных ветках (сегменты /latest, /rc и /deprecated), могут меняться. Модифицированные модели делят квоты на использование со своими базовыми моделями.

Модель и URI

Поколение

Контекст

Режимы работы

YandexGPT Lite
gpt://<идентификатор_каталога>/yandexgpt-lite

Deprecated 5
Latest 5
RC 5

32 000

Асинхронный, синхронный

YandexGPT Pro
gpt://<идентификатор_каталога>/yandexgpt

Deprecated 5
Latest 5
RC 5.1

32 000

Асинхронный, синхронный

Qwen3 235B
gpt://<идентификатор_каталога>/qwen3-235b-a22b-fp8/latest

—

256 000

OpenAI API

gpt-oss-120b
gpt://<идентификатор_каталога>/gpt-oss-120b/latest

—

128 000

OpenAI API

gpt-oss-20b
gpt://<идентификатор_каталога>/gpt-oss-20b/latest

—

128 000

OpenAI API

Дообученные текстовые модели
gpt://<идентификатор_каталога>/<базовая_модель>/<версия>@<суффикс>

Зависит от базовой модели

Зависит от базовой модели

Асинхронный, синхронный

Gemma 3 27B
gpt://<идентификатор_каталога>/gemma-3-27b-it/latest
Условия использования Gemma

—

128 000

OpenAI API

YandexART
art://<идентификатор_каталога>/yandex-art/latest

—

—

Асинхронный

1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.

Модель Gemma 3 27B работает с изображениями в кодировке Base64. Модель может обрабатывать изображения с любым соотношением сторон благодаря адаптивному алгоритму, который масштабирует изображения до 896 пикселей по большей стороне, сохраняя важные визуальные детали. Каждое изображение использует 256 токенов контекста.

Жизненный цикл моделиЖизненный цикл модели

Каждая модель имеет набор характеристик жизненного цикла: название модели, ветка и дата публикации. Эти характеристики позволяют однозначно определить версию модели. Обновление моделей происходит по определенным ниже правилам, чтобы вы могли адаптировать свои решения под новую версию, если это будет необходимо.

Существует три ветки модели (от более старой к новой): Deprecated, Latest, Release Candidate (RC). Для каждой из этих веток действует SLA сервиса.

Ветка RC обновляется по мере готовности новой модели и может измениться в любой момент. Когда модель в ветке RC будет готова к общему использованию, в истории изменений и сообществе пользователей в Telegram появится уведомление о предстоящем релизе.

Через месяц после объявления версия RC становится Latest, а Latest переносится в Deprecated. Поддержка версии Deprecated осуществляется в течение следующего месяца, после чего модели в ветках Deprecated и Latest будут идентичны.

Обращение к моделямОбращение к моделям

Вы можете обращаться к моделям генерации текста разных версий несколькими способами.

SDK
API

При работе с моделями генерации текста через Yandex Cloud ML SDK используйте один из следующих форматов:

  • Название модели, передается в виде строки. Доступны только версии Latest.

    # Генерация текста
    model = (
      sdk.models.completions("yandexgpt")
    )
    
    # Генерация изображений 
    model = (
      sdk.models.image_generation("yandex-art")
    )
    
  • Название и версия модели, передаются в виде строк в полях model_name и model_version соответственно.

    # Генерация текста
    model = (
      sdk.models.completions(model_name="yandexgpt-lite", model_version="rc")
    )
    
    # Генерация изображений 
    model = (
      sdk.models.image_generation(model_name="yandex-art", model_version="latest")
    )
    

    В приведенном примере явно заданы модели YandexGPT Lite версии Release Candidate и YandexART версии Latest.

  • URI модели, передается в виде строки, содержащей полный URI нужной версии модели. Также используйте этот способ для обращения к дообученным моделям.

    # Генерация текста
    model = (
      sdk.models.completions("gpt://b1gt6g8ht345********/yandexgpt/deprecated")
    )
    
    # Генерация изображений 
    model = (
      sdk.models.image_generation("art://b1gt6g8ht345********/yandex-art/latest")
    )
    

    В приведенном примере явно заданы модели YandexGPT Pro версии Deprecated и YandexART версии Latest.

Чтобы обратиться к моделям YandexGPT через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегменты /latest, /rc и /deprecated указывают на версию модели. По умолчанию используется сегмент /latest.

Для обращения к модели YandexART через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегмент /latest указывает на версию модели и является необязательным.

  • Обращение к версиям Latest:

    {
    
      "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/latest"
      ...
    
      "modelUri": "art://b1gt6g8ht345********/yandex-art/latest"
    }
    
  • Обращение к версии RC (при наличии):

    {
    
      "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/rc"
      ...
    }
    

См. такжеСм. также

  • Отправить запрос в промт-режиме
  • Отправить асинхронный запрос
  • Сгенерировать изображение с помощью YandexART
  • Запустить модель в пакетном режиме

Была ли статья полезна?

Предыдущая
Обзор
Следующая
Модели выделенного инстанса
Проект Яндекса
© 2025 ООО «Яндекс.Облако»