Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • AI Studio
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Managed Service for Greenplum®
  • Начало работы
    • Все инструкции
    • Подключение к базе данных
      • Обзор
        • S3
        • JDBC
        • HDFS
        • Hive
      • Создание внешней таблицы
      • Изменение настроек PXF
    • Подключение к внешнему файловому серверу (gpfdist)
    • Вспомогательные утилиты
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы
  1. Пошаговые инструкции
  2. Работа с PXF
  3. Создание внешних источников данных
  4. Hive

Создание внешнего источника данных Hive

Статья создана
Yandex Cloud
Обновлена 7 мая 2025 г.

В Managed Service for Greenplum® в качестве внешнего источника данных с типом подключения Hive можно использовать СУБД Hive в составе сервиса Yandex Data Processing или другие сторонние сервисы Hive.

Создайте внешний источникСоздайте внешний источник

Консоль управления
REST API
gRPC API
  1. Перейдите на страницу каталога и выберите сервис Managed Service for Greenplum.
  2. Откройте страницу нужного кластера Managed Service for Greenplum®.
  3. На панели слева выберите  PXF.
  4. Нажмите кнопку Создать источник данных.
  5. Выберите тип подключения Hive.
  6. Укажите имя источника.
  7. Задайте хотя бы одну опциональную настройку.
  8. Нажмите кнопку Создать.
  1. Получите IAM-токен для аутентификации в API и поместите токен в переменную среды окружения:

    export IAM_TOKEN="<IAM-токен>"
    
  2. Воспользуйтесь методом PXFDatasource.Create и выполните запрос, например, с помощью cURL:

    curl \
        --request POST \
        --header "Authorization: Bearer $IAM_TOKEN" \
        --header "Content-Type: application/json" \
        --url 'https://mdb.api.yandexcloud.kz/managed-greenplum/v1/clusters/<идентификатор_кластера>/pxf_datasources' \
        --data '{
                  "datasource": {
                    "name": "<имя_внешнего_источника_данных>",
                    "hive": {
                      "kerberos": {
                        "enable": <аутентификация_Kerberos>
                      },
                      ...
                    }
                  }
                }'
    

    Где:

    • name — имя внешнего источника данных.
    • hive — настройки внешнего источника данных. Задайте хотя бы одну опциональную настройку.

    Идентификатор кластера можно запросить со списком кластеров в каталоге.

  3. Убедитесь, что запрос был выполнен успешно, изучив ответ сервера.

  1. Получите IAM-токен для аутентификации в API и поместите токен в переменную среды окружения:

    export IAM_TOKEN="<IAM-токен>"
    
  2. Клонируйте репозиторий cloudapi:

    cd ~/ && git clone --depth=1 https://github.com/yandex-cloud/cloudapi
    

    Далее предполагается, что содержимое репозитория находится в директории ~/cloudapi/.

  3. Воспользуйтесь вызовом PXFDatasourceService.Create и выполните запрос, например, с помощью gRPCurl:

    grpcurl \
        -format json \
        -import-path ~/cloudapi/ \
        -import-path ~/cloudapi/third_party/googleapis/ \
        -proto ~/cloudapi/yandex/cloud/mdb/greenplum/v1/pxf_service.proto \
        -rpc-header "Authorization: Bearer $IAM_TOKEN" \
        -d '{
              "cluster_id": "<идентификатор_кластера>"
              "datasource": {
                "name": "<имя_внешнего_источника_данных>",
                "hive": {
                  "kerberos": {
                    "enable": <аутентификация_Kerberos>
                  },
                  ...
                }
              }
            }' \
        mdb.api.yandexcloud.kz:443 \
        yandex.cloud.mdb.greenplum.v1.PXFDatasourceService.Create
    

    Где:

    • name — имя внешнего источника данных.
    • hive — настройки внешнего источника данных. Задайте хотя бы одну опциональную настройку.

    Идентификатор кластера можно запросить со списком кластеров в каталоге.

  4. Убедитесь, что запрос был выполнен успешно, изучив ответ сервера.

Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками Broadcom Inc в США и/или других странах.

Была ли статья полезна?

Предыдущая
HDFS
Следующая
Создание внешней таблицы
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»