Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex DataSphere
  • Начало работы
    • О сервисе DataSphere
    • Взаимосвязь ресурсов в DataSphere
    • Сообщества
    • Управление расходами
    • Проект
    • Конфигурации вычислительных ресурсов
      • Ноды и алиасы
      • Проверки состояния и мониторинг
      • Метрики нод
    • Фундаментальные модели
    • Квоты и лимиты
    • Специальные условия для образования
  • Справочник Terraform
  • Аудитные логи Audit Trails
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений

В этой статье:

  • Ноды
  • Нода из модели
  • Нода из произвольного Docker-образа
  • Статусы ноды
  • Статусы инстанса
  • Алиас
  • Примеры использования
  1. Концепции
  2. DataSphere Inference
  3. Ноды и алиасы

DataSphere Inference

Статья создана
Yandex Cloud
Обновлена 30 апреля 2025 г.
  • Ноды
    • Нода из модели
    • Нода из произвольного Docker-образа
    • Статусы ноды
    • Статусы инстанса
  • Алиас
  • Примеры использования

DataSphere предоставляет инструменты для релиза сервисов, доступных для сторонних ресурсов. Вы можете развернуть для эксплуатации не только модель, обученную в DataSphere, но и создать при помощи тех же инструментов полноценный работающий сервис на базе Docker-образа.

Для публикации сервиса в DataSphere существуют специальные ресурсы — ноды и алиасы.

НодыНоды

Нода — это изолированная в собственном контуре группа специально созданных виртуальных машин (инстансов), между которыми распределяется вычислительная нагрузка. Инстансы ноды создаются с заранее определенным окружением и зафиксированным состоянием интерпретатора. В зависимости от потребностей вы можете выбрать различные конфигурации инстансов.

Важно

При развертывании и эксплуатации моделей вы платите за время работы каждого инстанса ноды — от момента запуска до момента удаления.

Если развернутый сервис вам больше не нужен, удалите ноду.

Обращение к нодам происходит по API. Запросы API могут менять состояние интерпретатора ноды. Для возврата первоначального состояния потребуется пересоздать всю ноду.

Примечание

Максимальный размер запроса и ответа API ноды — 16 МБ.

Для создания ноды укажите каталог облака вашей организации, в котором нода будет разворачивать инстансы и хранить логи. В каталоге необходимо настроить подсеть с доступом в интернет с помощью NAT-шлюза и создать сервисный аккаунт с ролью vpc.user. Укажите этот сервисный аккаунт в настройках проекта DataSphere.

Нода из моделиНода из модели

Ноды из моделей позволяют развернуть сохраненные в DataSphere модели в качестве сервиса и обращаться к нему по API. Ноду можно создать из следующих моделей:

  • LightGBM
  • ONNX
  • Tensorflow.Keras
  • Tensorflow
  • PyTorch
  • XGBoost

Если вы хотите развернуть модель, которую не поддерживает сервер Triton, вы можете конвертировать ее в формат ONNX или развернуть модель на основе Docker-образа.

Чтобы создать ноду из модели, обученной не в DataSphere, загрузите модель из файла в переменную в ноутбуке, а затем создайте из этой переменной модель DataSphere.

Для развертывания нод из моделей DataSphere использует Triton Inference Server. Вы можете развернуть несколько моделей, сохраненных в DataSphere, на одной ноде. DataSphere самостоятельно определит входные и выходные параметры, обеспечит работу API модели, а затем — предоставит мониторинг самой ноды и сервера Triton.

Примечание

При развертывании моделей PyTorch DataSphere не может автоматически определить входные и выходные параметры.

Нода из произвольного Docker-образаНода из произвольного Docker-образа

Ноды, развернутые из Docker-образа, размещенного в реестре контейнеров, будут полноценным рабочим сервисом. Docker-образ не обязательно должен содержать модель, обученную в DataSphere — вы можете создать любой образ и разместить его в удобном для вас реестре. О том, как загрузить Docker-образ в реестр Yandex Container Registry, см. Загрузить Docker-образ в реестр.

Примечание

Для использования Yandex Container Registry сервисному аккаунту проекта необходима роль container-registry.images.puller.

При создании ноды из Docker-образа вы сами определяете API создаваемой ноды, порт, который ваш сервис будет использовать, время соединения, формат собираемых метрик и другие параметры. После создания ноды DataSphere будет следить за ее состоянием, поддерживать работу инстансов и, при необходимости, масштабировать ноду в пределах заданного диапазона инстансов. Для инстансов доступны зоны доступности — ru-central1-a и ru-central1-b.

Для работы с нодой на основе большой модели или Docker-образа доступно подключение дополнительного диска размером от 10 до 4096 ГБ. Если у ноды есть несколько инстансов, диск будет создан для каждого из них.

Статусы нодыСтатусы ноды

Нода DataSphere может находиться в одном из статусов:

  • Healthy — количество инстансов со статусом Healthy в ноде равно минимальному числу требующихся инстансов;
  • Unhealthy — количество инстансов со статусом Healthy в ноде меньше минимально допустимого;
  • Created — нода только что создана;
  • Suspended — работа ноды приостановлена;
  • Deleting — нода в процессе удаления.

Статусы инстансаСтатусы инстанса

Инстансы ноды могут иметь один из следующих статусов:

  • Healthy – инстанс здоров и доступен для балансировки;
  • Unhealthy – с инстансом возникли проблемы, он исключен из балансировки;
  • Created – для инстанса создана ВМ;
  • Started – с ВМ инстанса установлена связь;
  • Preparing – инстанс подготавливается к обслуживанию запросов;
  • Deleting – инстанс находится в процессе удаления;
  • Undefined – начальное состояние инстанса, ВМ еще не создана.

АлиасАлиас

Алиас — специальный ресурс для публикации и обновления сервиса, который позволяет незаметно для пользователей заменять ноды и обновлять развернутый сервис во время работы.

Создайте алиас и используйте его в качестве эндпоинта сервиса. Вы можете изменять связанные с ним ноды, балансировать нагрузку между ними и убирать устаревшие версии Docker-образа незаметно для пользователя.

Примеры использованияПримеры использования

  • Создать ноду
  • Создать алиас
  • Развертывание сервиса из модели ONNX
  • Развертывание сервиса на основе Docker-образа
  • Развертывание сервиса на основе Docker-образа с FastAPI

Была ли статья полезна?

Предыдущая
Особенности работы с временными кластерами Yandex Data Processing
Следующая
Проверки состояния и мониторинг
Проект Яндекса
© 2025 ООО «Яндекс.Облако»