Миграция с API v1alpha на YandexGPT API v1 и Embeddings API v1

Статья создана

Обновлена 15 апреля 2024 г.

Выбор модели
Генерация
Токенизация
Векторизация

API версии v1alpha устарел и в ближайшее время перестанет поддерживаться. Для работы с YandexGPT используйте YandexGPT API v1 и Embeddings API v1. Максимальное суммарное количество токенов, которое может содержаться в запросе пользователя и ответе модели в новой версии API, составляет 8000.

Если ваш продукт использует методы устаревшего API, переведите его на использование нового интерфейса. Подробный обзор необходимых изменений для REST API приведен ниже. Изменения для gRPC API аналогичны.

Выбор модели

В YandexGPT API v1 и Embeddings API v1 указывайте название модели в параметре modelUri (вместо model в устаревшем API):

Модель	API v1alpha	YandexGPT API v1 и Embeddings API v1
YandexGPT Pro	`"model": "yagpt-2.0:hq"`	`"modelUri": "gpt://<идентификатор_каталога>/yandexgpt/latest"`
YandexGPT Lite	`"model": "general"`	`"modelUri": "gpt://<идентификатор_каталога>/yandexgpt-lite/latest"`

Генерация

Синхронный режим

Асинхронный режим

TextGeneration.instruct (промт-режим)

API-эндпойнт:

API v1alpha	YandexGPT API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/instruct`	`https://llm.api.cloud.yandex.net/foundationModels/v1/completion`

Общая структура запроса:

API v1alpha

YandexGPT API v1

{
  "model": "string",
  "generationOptions": {
    "partialResults": true,
    "temperature": "number",
    "maxTokens": "integer"
  },

  // только одно из полей: `instructionText` или `instructionUri`
  "instructionText": "string",
  "instructionUri": "string",

  "requestText": "string"
}

{
  "modelUri": "string",
  "completionOptions": {
    "stream": true,
    "temperature": "number",
    "maxTokens": "integer"
  },
  "messages": [
    {
      "role": "string",
      "text": "string"
    }
  ]
}

Поля тела запроса:

API v1alpha	YandexGPT API v1	Описание
model	modelUri	Идентификатор модели, которая будет использоваться для генерации ответа. Параметр содержит идентификатор каталога Yandex Cloud или идентификатор дообученной в DataSphere модели.
instructionText	`"messages": [ { "role": "system", "text": "string" } ]`	В YandexGPT API v1 блок `messages` — список сообщений, которые задают контекст запроса для модели. `role` — в значении `system` позволяет задать контекст запроса и определить поведение модели. `text` — текст, задающий контекст запроса.
instructionUri	modelUri	В YandexGPT API v1 параметр `instructionUri` не используется, URI задается в параметре `modelUri`.
requestText	`"messages": [ { "role": "user", "text": "string" } ]`	В YandexGPT API v1 блок `messages` — список сообщений, которые задают контекст запроса для модели. `role` — в значении `user` позволяет отправлять пользовательские сообщения к модели. `text` — текстовое сообщение запроса.
partialResults	stream	Включает потоковую передачу частично сгенерированного текста. Принимает значения `true` или `false`.
generationOptions	completionOptions	Задает параметры конфигурации запроса.
maxTokens	maxTokens	Имя параметра `maxTokens` осталось прежним, но его значение изменилось. В API v1alpha в параметре `maxTokens` задавалось ограничение на суммарное количество токенов в запросе и ответе. В YandexGPT API v1 значение параметра `maxTokens` — это максимальное количество токенов только в ответе.

TextGeneration.chat (режим чата)

API-эндпойнт:

API v1alpha	YandexGPT API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/chat`	`https://llm.api.cloud.yandex.net/foundationModels/v1/completion`

Общая структура запроса:

API v1alpha

YandexGPT API v1

{
  "model": "string",
  "generationOptions": {
    "partialResults": true,
    "temperature": "number",
    "maxTokens": "integer"
  },
  "messages": [
    {
      "role": "string",
      "text": "string"
    }
  ],
  "instructionText": "string"
}

{
  "modelUri": "string",
  "completionOptions": {
    "stream": true,
    "temperature": "number",
    "maxTokens": "integer"
  },
  "messages": [
    {
      "role": "string",
      "text": "string"
    }
  ]
}

Поля тела запроса:

API v1alpha	YandexGPT API v1	Описание
model	modelUri	Идентификатор модели, которая будет использоваться для генерации ответа. Параметр содержит идентификатор каталога Yandex Cloud или идентификатор дообученной в DataSphere модели.
instructionText	`"messages": [ { "role": "system", "text": "string" } ]`	В YandexGPT API v1 блок `messages` — список сообщений, которые задают контекст запроса для модели. `role` — в значении `system` позволяет задать контекст запроса и определить поведение модели. `text` — текст, задающий контекст запроса.
partialResults	stream	Включает потоковую передачу частично сгенерированного текста. Принимает значения `true` или `false`.
generationOptions	completionOptions	Задает параметры конфигурации запроса.
maxTokens	maxTokens	Имя параметра `maxTokens` осталось прежним, но значение изменилось. В API v1alpha в параметре `maxTokens` задавалось ограничение на суммарное количество токенов в запросе и ответе. В YandexGPT API v1 значение параметра `maxTokens` — это максимальное количество токенов только в ответе.
role	role	Имя параметра `role` осталось прежним, но список возможных значений изменился. В API v1alpha возможными значениями параметра были `Ассистент` и `Пользователь`. В YandexGPT API v1 возможные значения параметра — `assistant`, `user` и `system`.

API-эндпойнт:

API v1alpha	YandexGPT API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/instructAsync`	`https://llm.api.cloud.yandex.net/foundationModels/v1/completionAsync`

Общая структура запроса:

API v1alpha

YandexGPT API v1

{
  "model": "string",
  "generationOptions": {
    "partialResults": true,
    "temperature": "number",
    "maxTokens": "integer"
  },

  // только одно из полей: `instructionText` или `instructionUri` 
  "instructionText": "string",
  "instructionUri": "string",

  "requestText": "string"
}

{
  "modelUri": "string",
  "completionOptions": {
    "stream": true,
    "temperature": "number",
    "maxTokens": "integer"
  },
  "messages": [
    {
      "role": "string",
      "text": "string"
    }
  ]
}

Поля тела запроса:

API v1alpha	YandexGPT API v1	Описание
model	modelUri	Идентификатор модели, которая будет использоваться для генерации ответа. Параметр содержит идентификатор каталога Yandex Cloud или идентификатор дообученной в DataSphere модели.
instructionText	`"messages": [ { "role": "system", "text": "string" } ]`	В YandexGPT API v1 блок `messages` — список сообщений, которые задают контекст запроса для модели. `role` — в значении `system` позволяет задать контекст запроса и определить поведение модели. `text` — текст, задающий контекст запроса.
instructionUri	modelUri	В YandexGPT API v1 параметр `instructionUri` не используется, URI задается в параметре `modelUri`.
requestText	`"messages": [ { "role": "user", "text": "string" } ]`	В YandexGPT API v1 блок `messages` — список сообщений, которые задают контекст запроса для модели. `role` — в значении `user` позволяет отправлять пользовательские сообщения к модели. `text` — текстовое сообщение запроса.
partialResults	stream	Включает потоковую передачу частично сгенерированного текста. Принимает значения `true` или `false`.
generationOptions	completionOptions	Задает параметры конфигурации запроса.
maxTokens	maxTokens	Имя параметра `maxTokens` осталось прежним, но значение изменилось. В API v1alpha в параметре `maxTokens` задавалось ограничение на суммарное количество токенов в запросе и ответе. В YandexGPT API v1 значение параметра `maxTokens` — это максимальное количество токенов только в ответе.

Токенизация

Tokenizer.tokenizeCompletion

Tokenizer.tokenize

Метод используется только с методами генерации.

API-эндпойнт:

API v1alpha	YandexGPT API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/tokenize`	`https://llm.api.cloud.yandex.net/foundationModels/v1/tokenizeCompletion`

Общая структура запроса:

API v1alpha

YandexGPT API v1

{
  "model": "string",
  "text": "string"
}

{
  "modelUri": "string",
  "completionOptions": {
    "stream": true,
    "temperature": "number",
    "maxTokens": "integer"
  },
  "messages": [
    {
      "role": "string",
      "text": "string"
    }
  ]
}

Поля тела запроса:

API v1alpha	YandexGPT API v1	Описание
model	modelUri	Идентификатор модели, которая будет использоваться для генерации ответа. Параметр содержит идентификатор каталога Yandex Cloud или идентификатор дообученной в DataSphere модели.

Метод используется со всеми методами, кроме генерации.

API-эндпойнт:

API v1alpha	YandexGPT API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/tokenize`	`https://llm.api.cloud.yandex.net/foundationModels/v1/tokenize`

Общая структура запроса осталась без изменений:

API v1alpha	YandexGPT API v1
`{ "model": "string", "text": "string" }`	`{ "modelUri": "string", "text": "string" }`

Поля тела запроса:

API v1alpha	YandexGPT API v1	Описание
model	modelUri	Идентификатор модели, которая будет использоваться для генерации ответа. Параметр содержит идентификатор каталога Yandex Cloud или идентификатор дообученной в DataSphere модели.

Векторизация

API-эндпойнт:

API v1alpha	Embeddings API v1
`https://llm.api.cloud.yandex.net/llm/v1alpha/embedding`	`https://llm.api.cloud.yandex.net/foundationModels/v1/textEmbedding`

Общая структура запроса:

API v1alpha	Embeddings API v1
`{ "embeddingType": "string", "model": "string", "text": "string" }`	`{ "modelUri": "string", "text": "string" }`

Поля тела запроса:

API v1alpha	Embeddings API v1	Описание
model	—	В Embeddings API v1 модель векторного представления текста задается в параметре `modelUri`.
`"embeddingType" = "EMBEDDING_TYPE_QUERY"`	`"modelUri" = "emb://<идентификатор_каталога>/text-search-query/latest"`	Векторизация коротких текстов: поисковых запросов, обращений и т.п.
`"embeddingType" = "EMBEDDING_TYPE_DOCUMENT"`	`"modelUri" = "emb://<идентификатор_каталога>/text-search-doc/latest"`	Векторизация больших текстов исходных данных, например статей документации.

Миграция с API v1alpha на YandexGPT API v1 и Embeddings API v1

Выбор моделиВыбор модели

ГенерацияГенерация

ТокенизацияТокенизация

ВекторизацияВекторизация

Была ли статья полезна?

Выбор модели

Генерация

Токенизация

Векторизация