Создание внешнего источника данных Hive
В Managed Service for Greenplum® в качестве внешнего источника данных с типом подключения Hive можно использовать СУБД Hive в составе сервиса Yandex Data Processing или другие сторонние сервисы Hive.
Создайте внешний источник
- Перейдите на страницу каталога
и выберите сервис Managed Service for Greenplum. - Откройте страницу нужного кластера Managed Service for Greenplum®.
- На панели слева выберите
PXF. - Нажмите кнопку Создать источник данных.
- Выберите тип подключения
Hive
. - Укажите имя источника.
- Задайте хотя бы одну опциональную настройку.
- Нажмите кнопку Создать.
Чтобы добавить источник данных Hive в кластер Managed Service for Greenplum®, воспользуйтесь методом REST API create для ресурса PXFDatasource или вызовом gRPC API PXFDatasourceService/Create и передайте в запросе:
- Идентификатор кластера в параметре
clusterId
. Чтобы узнать идентификатор, получите список кластеров в каталоге. - Имя источника в параметре
name
. - Настройки внешнего источника в параметре
hive
.
Пример запроса REST API
В примере ниже рассматривается, как создать внешний источник данных Hive с помощью REST API Managed Service for Greenplum®. Чтобы создать источник:
-
Получите IAM-токен. Он используется для аутентификации в API.
-
Добавьте IAM-токен в переменную окружения:
export IAM_TOKEN=<токен>
-
Отправьте запрос с помощью утилиты cURL
:curl --location "https://mdb.api.cloud.yandex.net/managed-greenplum/v1/clusters/<идентификатор_кластера>/pxf_datasources" \ --header "Content-Type: text/plain" \ --header "Authorization: Bearer ${IAM_TOKEN}" \ --data "{ \"datasource\": { \"name\": \"hive:text\", \"hive\": { \"kerberos\": { \"enable\": true } } } }"
В теле запроса передаются параметры:
name
— имя источника, напримерhive:text
.enable
— активация протокола Kerberos для аутентификации клиента и сервера (опциональный параметр).
Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками VMware, Inc в США и/или других странах.