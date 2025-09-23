Связаться с намиПодключиться

Использовать дообученные классификаторы на базе YandexGPT

Статья создана
Обновлена 23 сентября 2025 г.

Чтобы выполнить запрос к любому типу дообученных классификаторов, используйте метод classify Text Classification API или Yandex Cloud ML SDK.

Перед началом работы

Чтобы воспользоваться примерами:

  1. Создайте сервисный аккаунт и назначьте ему роль ai.languageModels.user.

  2. Получите и сохраните API-ключ сервисного аккаунта.

    В примерах используется аутентификация с помощью API-ключа. Yandex Cloud ML SDK также поддерживает аутентификацию с помощью IAM-токена и OAuth-токена. Подробнее см. в разделе Аутентификация в Yandex Cloud ML SDK.

    Примечание

    Если вы используйте ОС Windows, рекомендуем предварительно установить оболочку WSL и выполнять дальнейшие действия в этой оболочке.

  3. Установите Python версии 3.10 или выше.

  4. Установите библиотеку Python venv для создания изолированных виртуальных окружений в Python.

  5. Создайте и войдите в новое виртуальное окружение Python:

    python3 -m venv new-env
source new-env/bin/activate

  6. С помощью менеджера пакетов pip установите библиотеку ML SDK:

    pip install yandex-cloud-ml-sdk

  1. Получите данные для аутентификации в API, как описано в разделе Аутентификация в API Yandex AI Studio.

  2. Чтобы воспользоваться примерами, установите cURL.

Отправьте запрос к классификатору

Чтобы отправить запрос к классификатору:

  1. Создайте файл classify.py и добавьте в него следующий код:

    #!/usr/bin/env python3

from __future__ import annotations
from yandex_cloud_ml_sdk import YCloudML

request_text = "Vieta's formulas"


def main():
    sdk = YCloudML(
        folder_id="<идентификатор_каталога>",
        auth="<API-ключ>",
    )

    model = sdk.models.text_classifiers(
        "cls://<идентификатор_каталога>/<идентификатор_классификатора>"
    )

    # The result will contain predictions within predefined classes
    # and the most weighty prediction will be "mathematics": 0.92
    result = model.run(request_text)

    for prediction in result:
        print(prediction)


if __name__ == "__main__":
    main()

    Где:

    • request_text — текстовое содержимое сообщения. Суммарное количество токенов на один запрос не должно превышать 8000.

      В качестве входных данных для запроса Yandex Cloud ML SDK может принимать строку, словарь, объект класса TextMessage или массив, содержащий любое сочетание указанных типов данных. Подробнее см. в разделе Использование Yandex Cloud ML SDK.

    Имена классов, по которым модель будет распределять запросы, должны быть заданы в процессе дообучения модели, поэтому не передаются в запросе.

  2. Выполните созданный файл:

    python3 classify.py

    В ответе сервис вернет результаты классификации с определенными значениями вероятности (confidence) принадлежности текста запроса к каждому из классов

Пример ниже разработан для выполнения в операционных системах MacOS и Linux. Чтобы выполнить его в системе Windows, ознакомьтесь с особенностями работы с Bash в Microsoft Windows.

  1. Создайте файл с телом запроса (например, body.json):

    {
  "modelUri": "cls://<URI_базовой_модели>/<версия>@<суффикс_дообучения>",
  "text": "<текст_запроса>"
}

    Где:

    • modelUriидентификатор модели, которая будет использоваться для классификации сообщения.
    • text — текстовое содержимое сообщения. Суммарное количество токенов на один запрос не должно превышать 8000.

    Имена классов, по которым модель будет распределять запросы, должны быть заданы в процессе дообучения модели, поэтому не передаются в запросе.

  2. Отправьте запрос к классификатору, выполнив команду:

    export IAM_TOKEN=<IAM-токен>
curl \
  --request POST \
  --header "Authorization: Bearer ${IAM_TOKEN}" \
  --data "@<путь_к_файлу_с_телом_запроса>" \
  "https://llm.api.cloud.yandex.net:443/foundationModels/v1/textClassification"

    Примечание

    Эндпоинт https://llm.api.cloud.yandex.net:443/foundationModels/v1/textClassification работает только с дообученными классификаторами. Для классификаторов по промту используйте https://llm.api.cloud.yandex.net/foundationModels/v1/fewShotTextClassification.

    В ответе сервис вернет результаты классификации с определенными значениями вероятности (confidence) принадлежности текста запроса к каждому из классов:

    {
  "predictions": [
    {
      "label": "<название_класса_1>",
      "confidence": 0.00010150671005249023
    },
    {
      "label": "<название_класса_2>",
      "confidence": 0.000008225440979003906
    },
    ...
    {
      "label": "<название_класса_n>",
      "confidence": 0.93212890625
    }
  ],
  "modelVersion": "<версия_модели>"
}

При многоклассовой классификации сумма значений полей вероятности (confidence) для всех классов всегда равна 1.

При классификации с несколькими метками значение поля вероятности (confidence) для каждого класса рассчитывается независимо (сумма значений не равна 1).

См. также

Предыдущая
Использовать классификаторы по промту
Следующая
Использовать эмбеддинги в поиске по базе знаний