Работа с шаблонами Yandex Data Processing
Шаблоны Yandex Data Processing позволяют заранее подготовить конфигурацию кластера для проекта и упростить развертывание временных кластеров. Список шаблонов доступен на странице проекта в блоке Ресурсы проекта → Yandex Data Processing, вкладка Доступные.
Для работы с кластерами Yandex Data Processing:
-
Укажите в настройках проекта следующие параметры:
- Каталог по умолчанию для интеграции с другими сервисами Yandex Cloud. В нем будет развернут кластер Yandex Data Processing в рамках текущих квот облака, а стоимость использования кластера будет списана с платежного аккаунта облака.
- Сервисный аккаунт с ролью
vpc.user, от имени которого DataSphere будет работать с сетью кластера Yandex Data Processing. - Подсеть для связи DataSphere с кластером Yandex Data Processing. Кластеру Yandex Data Processing необходим доступ в интернет, поэтому в подсети должен быть настроен NAT-шлюз. После указания подсети время выделения вычислительных ресурсов может быть увеличено.
-
Создайте сервисного агента:
-
Чтобы разрешить сервисному агенту работать в DataSphere, попросите администратора или владельца вашего облака выполнить команду в Yandex Cloud CLI:
yc iam service-control enable datasphere --cloud-id <идентификатор_облака>Где
--cloud-id— идентификатор облака, с которым вы будете работать в сообществе DataSphere. -
Создайте сервисный аккаунт с ролями:
dataproc.agent— для использования кластеров Yandex Data Processing.dataproc.admin— для создания кластеров из шаблонов Yandex Data Processing.vpc.user— для работы с сетью кластера Yandex Data Processing.iam.serviceAccounts.user— для создания ресурсов в каталоге от имени сервисного аккаунта.
-
В настройках сообщества в блоке Кластеры Spark нажмите Добавить сервисный аккаунт и выберите созданный сервисный аккаунт.
-
Важно
Постоянный кластер Yandex Data Processing должен иметь настройку livy:livy.spark.deploy-mode : client.
Создать шаблон Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. -
В блоке Ресурсы проекта нажмите Yandex Data Processing.
-
Нажмите Создать шаблон.
-
В поле Имя шаблона задайте имя. Требования к имени:
- длина — от 2 до 63 символов;
- может содержать строчные буквы латинского алфавита, цифры и дефисы;
- первый символ — буква, последний — не дефис.
-
Нажмите Создать. Откроется страница с информацией о созданном шаблоне.
Активировать шаблон Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Processing.
- Справа от нужного шаблона нажмите
и выберите Активировать.
Кластер на основе активированного шаблона Yandex Data Processing будет создан при запуске проекта в IDE.
Поделиться шаблоном Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Processing.
- Выберите нужный шаблон в списке.
- Перейдите на вкладку Доступ.
- Включите опцию видимости напротив названия сообщества, в котором нужно поделиться шаблоном.
Чтобы шаблон стал доступен для работы в другом проекте, администратор проекта должен добавить его на вкладке Доступные.
Изменить шаблон
Вы можете изменить только имя уже созданного шаблона. Чтобы изменить конфигурацию, создайте шаблон заново.
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Processing.
- Выберите нужный шаблон в списке, нажмите
и выберите Редактировать. - Измените имя и нажмите Сохранить.
Удалить шаблон Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Processing.
- Выберите в списке шаблон, который нужно удалить.
- Нажмите
и выберите Удалить. - Нажмите Подтвердить.
Важно
Фактически удаление ресурсов может занимать до 72 часов.