Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Foundation Models
    • Обзор
    • Аутентификация в API
        • Overview
          • Overview
          • Tokenize
          • TokenizeCompletion
  • Yandex Cloud ML SDK
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений

В этой статье:

  • gRPC request
  • TokenizeRequest
  • TokenizeResponse
  • Token
  1. Справочники API
  2. Text Generation API (англ.)
  3. gRPC
  4. Tokenizer
  5. Tokenize

Foundation Models Text Generation API, gRPC: TokenizerService.Tokenize

Статья создана
Yandex Cloud
Обновлена 26 ноября 2024 г.
  • gRPC request
  • TokenizeRequest
  • TokenizeResponse
  • Token

RPC method for tokenizing text.

gRPC requestgRPC request

rpc Tokenize (TokenizeRequest) returns (TokenizeResponse)

TokenizeRequestTokenizeRequest

{
  "model_uri": "string",
  "text": "string"
}

Request for the service to tokenize input text.

Field

Description

model_uri

string

The identifier of the model to be used for tokenization.

text

string

Text to be tokenized.

TokenizeResponseTokenizeResponse

{
  "tokens": [
    {
      "id": "int64",
      "text": "string",
      "special": "bool"
    }
  ],
  "model_version": "string"
}

Response containing tokenized content from request.

Field

Description

tokens[]

Token

A list of tokens obtained from tokenization.

model_version

string

Model version (changes with model releases).

TokenToken

Represents a token, the basic unit of content, used by the foundation model.

Field

Description

id

int64

An internal token identifier.

text

string

The textual representation of the token.

special

bool

Indicates whether the token is special or not. Special tokens may define the model's behavior and are not visible to users.

Была ли статья полезна?

Предыдущая
Overview
Следующая
TokenizeCompletion
Проект Яндекса
© 2025 ООО «Яндекс.Облако»