Работа с шаблонами Yandex Data Processing
Шаблоны Yandex Data Processing позволяют заранее подготовить конфигурацию кластера для проекта и упростить развертывание временных кластеров. Список шаблонов доступен на странице проекта в блоке Ресурсы проекта → Yandex Data Proc, вкладка Доступные.
Для работы с кластерами Yandex Data Processing укажите в настройках проекта следующие параметры:
-
Каталог по умолчанию для интеграции с другими сервисами Yandex Cloud. В нем будет развернут кластер Yandex Data Processing в рамках текущих квот облака, а стоимость использования кластера будет списана с платежного аккаунта облака.
-
Сервисный аккаунт, от имени которого DataSphere будет создавать и управлять кластерами. Сервисному аккаунту понадобятся следующие роли:
dataproc.agent
— для использования кластеров Yandex Data Processing.dataproc.admin
— для создания кластеров из шаблонов Yandex Data Processing.vpc.user
— для работы с сетью кластера Yandex Data Processing.iam.serviceAccounts.user
— для создания ресурсов в каталоге от имени сервисного аккаунта.
-
Подсеть для связи DataSphere с кластером Yandex Data Processing. Кластеру Yandex Data Processing необходим доступ в интернет, поэтому в подсети должен быть настроен NAT-шлюз.
Примечание
Если вы указали подсеть в настройках проекта, время выделения вычислительных ресурсов может быть увеличено.
Важно
Постоянный кластер Yandex Data Processing должен иметь настройку livy:livy.spark.deploy-mode : client
.
Создать шаблон Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. -
В блоке Ресурсы проекта нажмите
Yandex Data Proc. -
Нажмите Создать шаблон.
-
В поле Имя шаблона задайте имя. Требования к имени:
- длина — от 3 до 63 символов;
- может содержать строчные буквы латинского алфавита, цифры и дефисы;
- первый символ — буква, последний — не дефис.
-
Нажмите Создать. Откроется страница с информацией о созданном шаблоне.
Активировать шаблон Yandex Data Processing
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Proc.
- Справа от нужного шаблона нажмите
и выберите Активировать.
Кластер на основе активированного шаблона Yandex Data Processing будет создан при запуске проекта в IDE.
Поделиться шаблоном Yandex Data Processing
- {% include ui-find-project %}
<<<<<<< HEAD - В блоке Ресурсы проекта нажмите
=======
Yandex Data Proc. - В блоке Ресурсы проекта нажмите Yandex Data Proc.
develop
- Выберите нужный шаблон в списке.
- Перейдите на вкладку Доступ.
- Включите опцию видимости напротив названия сообщества, в котором нужно поделиться шаблоном.
Чтобы шаблон стал доступен для работы в другом проекте, администратор проекта должен добавить его на вкладке Доступные.
Изменить шаблон
Вы можете изменить только имя уже созданного шаблона. Чтобы изменить конфигурацию, создайте шаблон заново.
-
Выберите нужный проект в своем сообществе или на главной странице
DataSphere во вкладке Недавние проекты. - В блоке Ресурсы проекта нажмите Yandex Data Proc.
- Выберите нужный шаблон в списке, нажмите
и выберите Редактировать. - Измените имя и нажмите Сохранить.
Удалить шаблон Yandex Data Processing
- {% include ui-find-project %}
<<<<<<< HEAD - В блоке Ресурсы проекта нажмите Yandex Data Proc.
- Выберите в списке шаблон, который нужно удалить.
- Нажмите
и выберите Удалить. - Нажмите Подтвердить.
======= - В блоке Ресурсы проекта нажмите Yandex Data Proc.
- Выберите в списке шаблон, который нужно удалить.
- Нажмите
и выберите Удалить. - Нажмите Подтвердить.
Важно
Фактически удаление ресурсов может занимать до 72 часов.
develop