Модели базового инстанса
Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.
В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.
Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. При обновлении моделей поколения, доступные в разных ветках (сегменты /latest, /rc и /deprecated), могут меняться. Модифицированные модели делят квоты на использование со своими базовыми моделями.
|
Модель и URI |
Поколение |
Контекст |
|
|
YandexGPT Lite |
Deprecated 5Latest 5RC 5 |
32 000 |
Асинхронный, синхронный |
|
YandexGPT Pro |
Deprecated 5Latest 5RC 5.1 |
32 000 |
Асинхронный, синхронный |
|
Qwen3 235B |
— |
256 000 |
|
|
gpt-oss-120b |
— |
128 000 |
|
|
gpt-oss-20b |
— |
128 000 |
|
|
Дообученные текстовые модели |
Зависит от базовой модели |
Зависит от базовой модели |
Асинхронный, синхронный |
|
Gemma 3 27B |
— |
128 000 |
|
|
YandexART |
— |
— |
Асинхронный |
1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.
Модель Gemma 3 27B работает с изображениями в кодировке Base64. Модель может обрабатывать изображения с любым соотношением сторон благодаря адаптивному алгоритму, который масштабирует изображения до 896 пикселей по большей стороне, сохраняя важные визуальные детали. Каждое изображение использует 256 токенов контекста.
Жизненный цикл модели
Каждая модель имеет набор характеристик жизненного цикла: название модели, ветка и дата публикации. Эти характеристики позволяют однозначно определить версию модели. Обновление моделей происходит по определенным ниже правилам, чтобы вы могли адаптировать свои решения под новую версию, если это будет необходимо.
Существует три ветки модели (от более старой к новой): Deprecated, Latest, Release Candidate (RC). Для каждой из этих веток действует SLA сервиса.
Ветка RC обновляется по мере готовности новой модели и может измениться в любой момент. Когда модель в ветке RC будет готова к общему использованию, в истории изменений и сообществе пользователей
Через месяц после объявления версия RC становится Latest, а Latest переносится в Deprecated. Поддержка версии Deprecated осуществляется в течение следующего месяца, после чего модели в ветках Deprecated и Latest будут идентичны.
Обращение к моделям
Вы можете обращаться к моделям генерации текста разных версий несколькими способами.
При работе с моделями генерации текста через Yandex Cloud ML SDK используйте один из следующих форматов:
-
Название модели, передается в виде строки. Доступны только версии
Latest.# Генерация текста model = ( sdk.models.completions("yandexgpt") ) # Генерация изображений model = ( sdk.models.image_generation("yandex-art") ) -
Название и версия модели, передаются в виде строк в полях
model_nameиmodel_versionсоответственно.# Генерация текста model = ( sdk.models.completions(model_name="yandexgpt-lite", model_version="rc") ) # Генерация изображений model = ( sdk.models.image_generation(model_name="yandex-art", model_version="latest") )В приведенном примере явно заданы модели
YandexGPT LiteверсииRelease CandidateиYandexARTверсииLatest. -
URI модели, передается в виде строки, содержащей полный URI нужной версии модели. Также используйте этот способ для обращения к дообученным моделям.
# Генерация текста model = ( sdk.models.completions("gpt://b1gt6g8ht345********/yandexgpt/deprecated") ) # Генерация изображений model = ( sdk.models.image_generation("art://b1gt6g8ht345********/yandex-art/latest") )В приведенном примере явно заданы модели
YandexGPT ProверсииDeprecatedиYandexARTверсииLatest.
Чтобы обратиться к моделям YandexGPT через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегменты /latest, /rc и /deprecated указывают на версию модели. По умолчанию используется сегмент /latest.
Для обращения к модели YandexART через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегмент /latest указывает на версию модели и является необязательным.
-
Обращение к версиям
Latest:{ "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/latest" ... "modelUri": "art://b1gt6g8ht345********/yandex-art/latest" } -
Обращение к версии
RC(при наличии):{ "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/rc" ... }