Работа с PXF
Протокол Greenplum® Platform Extension Framework
Допустим, есть таблица, которая отражает данные по продажам за несколько лет. В ней есть три вида данных:
- горячие данные за последние несколько месяцев, хранятся в MySQL®;
- теплые данные за последние несколько лет, хранятся в Greenplum®;
- холодные данные за более поздний период, хранятся в S3.
Чем холоднее данные, тем реже к ним обращаются.
Чтобы распределить данные по нескольким СУБД и иметь доступ к ним, с помощью PXF создаются внешние таблицы — специальные объекты в Greenplum®, которые ссылаются на таблицы, бакеты или файлы внешних источников. В этом разделе приведены инструкции, как создать внешние таблицы, ссылающиеся на внешние СУБД.
Для таких таблиц можно указать настройки внешнего источника данных в SQL-запросе. Либо вы можете создать источник в Managed Service for Greenplum® с нужными настройками и передать этот источник в SQL-запросе.
Перед началом работы
- В подсети кластера Managed Service for Greenplum® настройте NAT-шлюз и привяжите таблицу маршрутизации.
- В той же подсети создайте группу безопасности, разрешающую весь входящий и исходящий трафик со всех адресов.
Начните работу с внешними таблицами по протоколу PXF
-
Добавьте источник данных в Managed Service for Greenplum®. Инструкции по добавлению источника зависят от его типа подключения:
-
Создайте внешнюю таблицу по протоколу PXF.
-
(Опционально) Измените настройки PXF, заданные по умолчанию.
Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками VMware, Inc в США и/или других странах.