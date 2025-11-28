Связаться с намиПопробовать бесплатно

Удалить датасет

Статья создана
Обновлена 11 декабря 2025 г.

Перед началом работы

Чтобы воспользоваться примерами:

Для работы из консоли управления подготовительные действия не требуются.

  1. Создайте сервисный аккаунт и назначьте ему роль ai.editor.

  2. Получите и сохраните API-ключ сервисного аккаунта с заданной областью действия yc.ai.foundationModels.execute.

    В примерах используется аутентификация с помощью API-ключа. Yandex Cloud ML SDK также поддерживает аутентификацию с помощью IAM-токена и OAuth-токена. Подробнее см. в разделе Аутентификация в Yandex Cloud ML SDK.

  3. С помощью менеджера пакетов pip установите библиотеку ML SDK:

    pip install yandex-cloud-ml-sdk

  1. Получите данные для аутентификации в API, как описано в разделе Аутентификация в API Yandex AI Studio.

  2. Чтобы воспользоваться примерами, установите cURL.

  3. Установите gRPCurl.

  4. (Опционально) Установите утилиту jq для потоковой обработки JSON-файлов.

  5. Получите IAM-токен для аутентификации в API.

    Аккаунту, для которого вы получаете IAM-токен, должна быть назначена роль ai.editor или выше.

    Примечание

    У IAM-токена короткое время жизни — не более 12 часов.

Удалите датасет

Чтобы удалить датасет:

  1. В консоли управления выберите каталог, на который у вашего аккаунта есть роли ai.playground.user и ai.datasets.editor или выше.
  2. Перейдите в сервис AI Studio.
  3. На панели AI Studio выберите Датасеты.
  4. В открывшемся списке в строке с нужным датасетом нажмите значок и выберите Удалить.
  5. В открывшемся окне подтвердите удаление.

  1. Создайте файл dataset-delete.py и добавьте в него следующий код:

    from __future__ import annotations

from yandex_cloud_ml_sdk import YCloudML

YANDEX_API_KEY = "<API-ключ>"
YANDEX_FOLDER_ID = "<идентификатор_каталога>"
DATASET_ID = "<идентификатор_датасета>"


def main() -> None:

    sdk = YCloudML(
        folder_id=YANDEX_FOLDER_ID,
        auth=YANDEX_API_KEY,
    )

    # Сохраняем объект с удаляемым датасетом в переменную
    dataset_to_delete = sdk.datasets.get(dataset_id=DATASET_ID)

    # Удаляем датасет
    dataset_to_delete.delete()


if __name__ == "__main__":
    main()

    Где:

    • YANDEX_API_KEY — полученный перед началом работы API-ключ сервисного аккаунта.

    • YANDEX_FOLDER_IDидентификатор каталога, в котором находится удаляемый датасет.

    • DATASET_ID — идентификатор датасета, который необходимо удалить. Посмотреть список всех датасетов в каталоге можно в консоли управления или с помощью API.

      Через ML SDK посмотреть список датасетов в каталоге можно с помощью метода list():

      for dataset in sdk.datasets.list():
    print(f"List of existing datasets {dataset=}")

  2. Выполните созданный файл:

    python3 dataset-delete.py

    В результате указанный датасет будет удален.

  1. Получите идентификатор датасета, который вы хотите удалить:

    grpcurl \
  -H "Authorization: Bearer <IAM-токен>" \
  -d @ \
  llm.api.cloud.yandex.net:443 yandex.cloud.ai.dataset.v1.DatasetService/List <<EOM
  {
    "folder_id": "<идентификатор_каталога>"
  }
EOM

    Где:

    Результат:

     {
   "datasets": [
     {
       "datasetId": "fdsl9hf65509********",
       "folderId": "b1gt6g8ht345********",
       "name": "sample-dataset",
       "status": "READY",
       "taskType": "TextToTextGeneration",
       "createdAt": "2025-11-28T08:53:59Z",
       "updatedAt": "2025-11-28T08:54:38Z",
       "rows": "354",
       "sizeBytes": "32314",
       "createdById": "ajeol2afu1js********",
       "createdBy": "ajeol2afu1js********"
     }
   ]
 }

    Сохраните идентификатор удаляемого датасета (значение поля datasetId) — он понадобится при удалении датасета.

  2. Удалите датасет:

    grpcurl \
  -H "Authorization: Bearer <IAM-токен>" \
  -d @ \
  llm.api.cloud.yandex.net:443 yandex.cloud.ai.dataset.v1.DatasetService/Delete <<EOM
  {
    "dataset_id": "<идентификатор_датасета>"
  }
EOM

    Где:

    • <IAM-токен>IAM-токен сервисного аккаунта, полученный перед началом работы.
    • <идентификатор_датасета> — идентификатор датасета, сохраненный на предыдущем шаге.

    В результате gRPC-вызова указанный датасет будет удален.

См. также

Предыдущая
Создать датасет для дообучения классификации текста
Следующая
Дообучить модель генерации текста