Модели базового инстанса
Сервис Yandex AI Studio предоставляет доступ к большим генеративным моделям, разработанных разными компаниями. Если стандартных моделей вам недостаточно, вы можете дообучить некоторые модели, чтобы они точнее отвечали на ваши запросы. Все роли, необходимые для работы с моделями, перечислены в разделе Управление доступом в Yandex AI Studio.
В базовом инстансе ресурсы модели доступны всем пользователям Yandex Cloud и делятся между ними, поэтому при большой нагрузке время работы моделей может увеличиваться. При этом другие пользователи гарантированно не могут получить доступ к контексту ваших переписок с моделью: даже при включенном режиме логирования запросы хранятся в обезличенном виде, а потенциально чувствительная информация маскируется. Однако если вы обрабатываете конфиденциальную информацию с помощью моделей, рекомендуем отключать логирование данных.
Для моделей базового инстанса действуют правила обновления, описанные в разделе Жизненный цикл модели. При обновлении моделей поколения, доступные в разных ветках (сегменты /latest, /rc и /deprecated), могут меняться. Модифицированные модели делят квоты на использование со своими базовыми моделями.
|
Модель и URI |
Контекст |
Доступные API |
|
Alice AI LLM |
32 768 |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Pro 5.1 |
32 768 |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Pro 5 |
32 768 |
API генерации текста, OpenAI-совместимые API |
|
YandexGPT Lite 5 |
32 768 |
API генерации текста, OpenAI-совместимые API |
|
Qwen3 235B |
262 144 |
OpenAI-совместимые API |
|
gpt-oss-120b |
131 072 |
OpenAI-совместимые API |
|
gpt-oss-20b |
131 072 |
OpenAI-совместимые API |
|
Дообученная YandexGPT Lite |
32 768 |
API генерации текста, OpenAI-совместимые API |
|
Gemma 3 27B |
131 072 |
OpenAI-совместимые API |
|
YandexART |
500 символов |
API генерации изображений |
Модель Gemma 3 27B работает с изображениями в кодировке Base64. Модель может обрабатывать изображения с любым соотношением сторон благодаря адаптивному алгоритму, который масштабирует изображения до 896 пикселей по большей стороне, сохраняя важные визуальные детали. Каждое изображение использует 256 токенов контекста.
Жизненный цикл модели
Каждая модель имеет набор характеристик жизненного цикла: название модели, ветка и дата публикации. Эти характеристики позволяют однозначно определить версию модели. Обновление моделей происходит по определенным ниже правилам, чтобы вы могли адаптировать свои решения под новую версию, если это будет необходимо.
Существует три ветки модели (от более старой к новой): Deprecated, Latest, Release Candidate (RC). Для каждой из этих веток действует SLA сервиса.
Ветка RC обновляется по мере готовности новой модели и может измениться в любой момент. Когда модель в ветке RC будет готова к общему использованию, в истории изменений и сообществе пользователей
Через месяц после объявления версия RC становится Latest, а Latest переносится в Deprecated. Поддержка версии Deprecated осуществляется в течение следующего месяца, после чего модели в ветках Deprecated и Latest будут идентичны.
Обращение к моделям
Вы можете обращаться к моделям генерации текста разных версий несколькими способами.
При работе с моделями генерации текста через Yandex Cloud ML SDK используйте один из следующих форматов:
-
Название модели, передается в виде строки. Доступны только версии
Latest.# Генерация текста model = ( sdk.models.completions("yandexgpt") ) # Генерация изображений model = ( sdk.models.image_generation("yandex-art") ) -
Название и версия модели, передаются в виде строк в полях
model_nameиmodel_versionсоответственно.# Генерация текста model = ( sdk.models.completions(model_name="yandexgpt-lite", model_version="rc") ) # Генерация изображений model = ( sdk.models.image_generation(model_name="yandex-art", model_version="latest") )В приведенном примере явно заданы модели
YandexGPT LiteверсииRelease CandidateиYandexARTверсииLatest. -
URI модели, передается в виде строки, содержащей полный URI нужной версии модели. Также используйте этот способ для обращения к дообученным моделям.
# Генерация текста model = ( sdk.models.completions("gpt://b1gt6g8ht345********/yandexgpt/deprecated") ) # Генерация изображений model = ( sdk.models.image_generation("art://b1gt6g8ht345********/yandex-art/latest") )В приведенном примере явно заданы модели
YandexGPT ProверсииDeprecatedиYandexARTверсииLatest.
Чтобы обратиться к моделям YandexGPT через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегменты /latest, /rc и /deprecated указывают на версию модели. По умолчанию используется сегмент /latest.
Для обращения к модели YandexART через REST API или gRPC API, в поле modelUri тела запроса укажите URI модели, содержащий идентификатор каталога. Сегмент /latest указывает на версию модели и является необязательным.
-
Обращение к версиям
Latest:{ "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/latest" ... "modelUri": "art://b1gt6g8ht345********/yandex-art/latest" } -
Обращение к версии
RC(при наличии):{ "modelUri": "gpt://b1gt6g8ht345********/yandexgpt-lite/rc" ... }