Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex AI Studio
  • Начало работы с Model Gallery
    • О сервисе Yandex AI Studio
      • Обзор
      • Модели базового инстанса
      • Модели выделенного инстанса
      • Пакетная обработка данных
      • Вызов функций
      • Режим рассуждений
      • Форматирование ответов моделей
      • Эмбеддинги
      • Датасеты
      • Дообучение
      • Токены
    • Yandex Workflows
    • Квоты и лимиты
    • Термины и определения
  • Переход с AI Assistant API на Responses API
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений

В этой статье:

  • Пример
  • Токенизировать текст для YandexGPT Pro
  1. Концепции
  2. Model Gallery
  3. Токены

Токены

Статья создана
Yandex Cloud
Обновлена 26 ноября 2025 г.
  • Пример
    • Токенизировать текст для YandexGPT Pro

Нейросети работают с текстами, представляя слова и предложения в виде токенов — смысловых отрывков или часто встречающихся последовательностей символов, характерных для естественного языка. Токены позволяют нейросетям находить закономерности и обрабатывать естественный язык.

Каждая модель использует свой токенизатор для обработки текстов, поэтому количество токенов в одном и том же тексте будет отличаться. При работе с моделями через OpenAI-совместимые API количество использованных токенов возвращается в каждом ответе модели в поле usage. Если же вы хотите предварительно оценить, сколько токенов содержится в тексте, воспользуйтесь токенизатором выбранной модели.

Модели Яндекса используют токенизатор, специально оптимизированный для работы с текстами на русском языке. Это позволяет увеличить среднее количество символов в токене и уменьшить стоимость обработки текста. Вы можете бесплатно оценить размер любого текста в токенах в представлении моделей Яндекса с помощью специальных методов Tokenizer или Yandex Cloud ML SDK.

Чтобы использовать токенизатор в AI Studio, необходима роль ai.languageModels.user или выше на каталог.

ПримерПример

Примечание

Все примеры приведены для иллюстрации и не отражают итоговое количество токенов, которое будет израсходовано в реальных задачах. Коэффициенты получены с помощью расчетов, для оценки количества токенов в тексте использованы токенайзеры, доступные в интернете.

  • Текст на русском: Управление генеративными моделями осуществляется с помощью промптов. Эффективный промпт должен содержать контекст запроса (инструкцию) для модели и непосредственно задание, которое модель должна выполнить, учитывая переданный контекст. Чем конкретнее составлен промпт, тем более точными будут результаты работы модели.\n Кроме промпта на результаты генерации моделей будут влиять и другие параметры запроса. Используйте AI Playground, доступный в консоли управления, чтобы протестировать ваши запросы.
    Количество символов в тексте: 501.

    YandexGPT Pro Qwen3 235B gpt-oss-120b
    Количество токенов в тексте 96 139 109
    Среднее количество символов в токене 5,2 3,6 4,6
  • Текст на английском языке: Generative models are managed using prompts. A good prompt should contain the context of your request to the model (instruction) and the actual task the model should complete based on the provided context. The more specific your prompt, the more accurate will be the results returned by the model.\n Apart from the prompt, other request parameters will impact the model's output too. Use Foundation Models Playground available from the management console to test your requests.
    Количество символов в промпте: 477.

    Alice AI LLM Qwen3 235B gpt-oss-120b
    Количество токенов в тексте 89 87 87
    Среднее количество символов в токене 5,36 5,48 5,48

Токенизировать текст для YandexGPT ProТокенизировать текст для YandexGPT Pro

  1. Создайте файл tbody.json, содержащий параметры запроса:

    {
      "modelUri": "gpt://<идентификатор_каталога>/yandexgpt",
      "text": "Управление генеративными моделями осуществляется с помощью промптов. Эффективный промпт должен содержать контекст запроса (инструкцию) для модели и непосредственно задание, которое модель должна выполнить, учитывая переданный контекст. Чем конкретнее составлен промпт, тем более точными будут результаты работы модели.\n Кроме промпта на результаты генерации моделей будут влиять и другие параметры запроса. Используйте AI Playground, доступный в консоли управления, чтобы протестировать ваши запросы."
    }
    

    Где <идентификатор_каталога> — идентификатор каталога Yandex Cloud, на который у вашего аккаунта есть роль ai.languageModels.user или выше.

  2. Отправьте запрос к модели:

    export IAM_TOKEN=<IAM-токен>
    curl --request POST \
      --header "Authorization: Bearer ${IAM_TOKEN}" \
      --data "@tbody.json" \
      "https://llm.api.cloud.yandex.net/foundationModels/v1/tokenize"
    

    Где:

    • <IAM-токен> — значение IAM-токена, полученного для вашего аккаунта.
    • tbody.json — файл в формате JSON, содержащий параметры запроса.
    Результат
    {
      "tokens": [
        {
          "id": "1",
          "text": "<s>",
          "special": true
        },
        {
          "id": "19078",
          "text": "▁Управление",
          "special": false
        },
        {
          "id": "10810",
          "text": "▁генера",
          "special": false
        },
        {
          "id": "26991",
          "text": "тивными",
          "special": false
        },
        {
          "id": "77514",
          "text": "▁моделями",
          "special": false
        },
        {
          "id": "10578",
          "text": "▁осуществляется",
          "special": false
        },
        {
          "id": "277",
          "text": "▁с",
          "special": false
        },
        {
          "id": "4390",
          "text": "▁помощью",
          "special": false
        },
        {
          "id": "398",
          "text": "▁про",
          "special": false
        },
        {
          "id": "59313",
          "text": "мп",
          "special": false
        },
        {
          "id": "769",
          "text": "тов",
          "special": false
        },
        {
          "id": "125820",
          "text": ".",
          "special": false
        },
        {
          "id": "43429",
          "text": "▁Эффек",
          "special": false
        },
        {
          "id": "7146",
          "text": "тивный",
          "special": false
        },
        {
          "id": "68740",
          "text": "▁пром",
          "special": false
        },
        {
          "id": "7359",
          "text": "пт",
          "special": false
        },
        {
          "id": "4923",
          "text": "▁должен",
          "special": false
        },
        {
          "id": "29443",
          "text": "▁содержать",
          "special": false
        },
        {
          "id": "24719",
          "text": "▁контек",
          "special": false
        },
        {
          "id": "269",
          "text": "ст",
          "special": false
        },
        {
          "id": "43640",
          "text": "▁запроса",
          "special": false
        },
        {
          "id": "355",
          "text": "▁(",
          "special": false
        },
        {
          "id": "98434",
          "text": "инструк",
          "special": false
        },
        {
          "id": "1511",
          "text": "цию",
          "special": false
        },
        {
          "id": "125855",
          "text": ")",
          "special": false
        },
        {
          "id": "571",
          "text": "▁для",
          "special": false
        },
        {
          "id": "6234",
          "text": "▁модели",
          "special": false
        },
        {
          "id": "286",
          "text": "▁и",
          "special": false
        },
        {
          "id": "15616",
          "text": "▁непосредственно",
          "special": false
        },
        {
          "id": "19633",
          "text": "▁задание",
          "special": false
        },
        {
          "id": "125827",
          "text": ",",
          "special": false
        },
        {
          "id": "6050",
          "text": "▁которое",
          "special": false
        },
        {
          "id": "7549",
          "text": "▁модель",
          "special": false
        },
        {
          "id": "7160",
          "text": "▁должна",
          "special": false
        },
        {
          "id": "18879",
          "text": "▁выполнить",
          "special": false
        },
        {
          "id": "125827",
          "text": ",",
          "special": false
        },
        {
          "id": "31323",
          "text": "▁учитывая",
          "special": false
        },
        {
          "id": "818",
          "text": "▁пере",
          "special": false
        },
        {
          "id": "56857",
          "text": "данный",
          "special": false
        },
        {
          "id": "24719",
          "text": "▁контек",
          "special": false
        },
        {
          "id": "269",
          "text": "ст",
          "special": false
        },
        {
          "id": "125820",
          "text": ".",
          "special": false
        },
        {
          "id": "10500",
          "text": "▁Чем",
          "special": false
        },
        {
          "id": "8504",
          "text": "▁конкре",
          "special": false
        },
        {
          "id": "93886",
          "text": "тнее",
          "special": false
        },
        {
          "id": "73199",
          "text": "▁составлен",
          "special": false
        },
        {
          "id": "68740",
          "text": "▁пром",
          "special": false
        },
        {
          "id": "7359",
          "text": "пт",
          "special": false
        },
        {
          "id": "125827",
          "text": ",",
          "special": false
        },
        {
          "id": "1819",
          "text": "▁тем",
          "special": false
        },
        {
          "id": "1800",
          "text": "▁более",
          "special": false
        },
        {
          "id": "470",
          "text": "▁то",
          "special": false
        },
        {
          "id": "10969",
          "text": "чными",
          "special": false
        },
        {
          "id": "3315",
          "text": "▁будут",
          "special": false
        },
        {
          "id": "11306",
          "text": "▁результаты",
          "special": false
        },
        {
          "id": "1630",
          "text": "▁работы",
          "special": false
        },
        {
          "id": "6234",
          "text": "▁модели",
          "special": false
        },
        {
          "id": "125820",
          "text": ".",
          "special": false
        },
        {
          "id": "3",
          "text": "[NL]",
          "special": true
        },
        {
          "id": "8816",
          "text": "▁Кроме",
          "special": false
        },
        {
          "id": "68740",
          "text": "▁пром",
          "special": false
        },
        {
          "id": "35211",
          "text": "пта",
          "special": false
        },
        {
          "id": "324",
          "text": "▁на",
          "special": false
        },
        {
          "id": "11306",
          "text": "▁результаты",
          "special": false
        },
        {
          "id": "103637",
          "text": "▁генерации",
          "special": false
        },
        {
          "id": "16028",
          "text": "▁моделей",
          "special": false
        },
        {
          "id": "3315",
          "text": "▁будут",
          "special": false
        },
        {
          "id": "54120",
          "text": "▁влиять",
          "special": false
        },
        {
          "id": "286",
          "text": "▁и",
          "special": false
        },
        {
          "id": "3669",
          "text": "▁другие",
          "special": false
        },
        {
          "id": "16564",
          "text": "▁параметры",
          "special": false
        },
        {
          "id": "43640",
          "text": "▁запроса",
          "special": false
        },
        {
          "id": "125820",
          "text": ".",
          "special": false
        },
        {
          "id": "38756",
          "text": "▁Используйте",
          "special": false
        },
        {
          "id": "15418",
          "text": "▁AI",
          "special": false
        },
        {
          "id": "118637",
          "text": "▁Playground",
          "special": false
        },
        {
          "id": "125827",
          "text": ",",
          "special": false
        },
        {
          "id": "58115",
          "text": "▁доступный",
          "special": false
        },
        {
          "id": "273",
          "text": "▁в",
          "special": false
        },
        {
          "id": "43319",
          "text": "▁консоли",
          "special": false
        },
        {
          "id": "5320",
          "text": "▁управления",
          "special": false
        },
        {
          "id": "125827",
          "text": ",",
          "special": false
        },
        {
          "id": "1387",
          "text": "▁чтобы",
          "special": false
        },
        {
          "id": "114781",
          "text": "▁протестировать",
          "special": false
        },
        {
          "id": "8523",
          "text": "▁ваши",
          "special": false
        },
        {
          "id": "39192",
          "text": "▁запросы",
          "special": false
        },
        {
          "id": "125820",
          "text": ".",
          "special": false
        }
      ],
      "modelVersion": "09.02.2025"
    }
    

Была ли статья полезна?

Предыдущая
Дообучение
Следующая
Обзор AI-агентов
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»