Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex AI Studio
  • О сервисе Yandex AI Studio
  • Начало работы с Model Gallery
  • Yandex Workflows
    • Все инструкции
    • Отключить логирование запросов
    • Получить API-ключ
      • Генерация изображений
      • Мультимодальные модели
      • Пакетная обработка данных
  • Переход с AI Assistant API на Responses API
  • Совместимость с OpenAI
  • Квоты и лимиты
  • Правила тарификации
  • Управление доступом
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Термины и определения
  1. Пошаговые инструкции
  2. Model Gallery
  3. Мультимодальные модели

Отправить запрос мультимодальной модели

Статья создана
Yandex Cloud
Обновлена 29 декабря 2025 г.

В AI Studio вы можете отправлять запросы мультимодальным моделям, которые могут анализировать изображения и возвращать ответ в виде текста. Изображения передаются в кодировке Base64.

Примечание

В AI Playground работа с мультимодальными моделями пока недоступна.

Чтобы воспользоваться примером, создайте сервисный аккаунт с ролью ai.languageModels.user и получите для него API-ключ с областью действия yc.ai.foundationModels.execute.

Python
from openai import OpenAI
import base64

YC_API_KEY = "<API-ключ>"
YC_FOLDER_ID = "<идентификатор_каталога>"

client = OpenAI(
    api_key=YC_API_KEY,
    base_url="https://ai.api.cloud.yandex.net/v1",
)


# Вспомогательный метод для конвертации изображений в Base64
def image_to_base64(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')


# Изображения для сравнения
image1_base64 = image_to_base64("image1.png")
image2_base64 = image_to_base64("image2.png")

# Для примера используется модель Gemma 3 27B it
response = client.chat.completions.create(
    model=f"gpt://{YC_FOLDER_ID}/gemma-3-27b-it",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Сравни эти две картинки"
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{image1_base64}"
                    }
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{image2_base64}"
                    }
                }
            ]
        }
    ]
)

print(response.choices[0].message.content)

Где:

  • YC_API_KEY — полученный API-ключ сервисного аккаунта.
  • YC_FOLDER_ID — идентификатор каталога сервисного аккаунта.
Пример ответа модели
**Первое изображение:**

*   **Объект:** Маленький пингвинёнок.
*   **Характеристики:** Пингвинёнок покрыт пухом, у него милое выражение лица. У него перед собой ноутбук.
*   **Фон:** Белый заснеженный пейзаж.

**Второе изображение:**

*   **Объект:** Енот, завернутый в белое махровое полотенце.
*   **Характеристики:** Выражение лица енота задумчивое, немного грустное.
*   **Фон:** Похоже на ванную комнату или другую бытовую комнату.

**Основные различия:**

*   **Виды животных:** Пингвин и енот - два совершенно разных животных, живущих в разных средах.
*   **Обстановка:** Одно изображение сделано на природе (снег), а другое - в помещении.
*   **Действия:** Пингвинёнок, похоже, "работает" или просто смотрит на ноутбук, а енот, похоже, отдыхает после купания.

В целом, обе картинки очень милые и вызывают положительные эмоции, но показывают очень разные ситуации и животных.

Была ли статья полезна?

Предыдущая
Генерация изображений
Следующая
Пакетная обработка данных
Проект Яндекса
© 2025 ООО «Яндекс.Облако»