Настройки Greenplum®
Для кластера в сервисе Yandex MPP Analytics for PostgreSQL можно задать настройки, которые относятся к Greenplum®. Часть настроек задается на уровне кластера, часть — на уровне внешних источников данных: S3, JDBC, HDFS, Hive.
Метки рядом с названием настройки позволяют определить, с помощью какого интерфейса задается значение этой настройки: консоль управления, CLI, API, SQL или Terraform. Метка Все интерфейсы указывает, что поддерживаются все перечисленные интерфейсы.
В зависимости от выбранного интерфейса, одна и та же настройка будет представлена по-разному. Например, Max connections в консоли управления соответствует:
max_connectionsв gRPC API;maxConnectionsв REST API.
Зависимость настроек от размера хранилища
Значения некоторых настроек Greenplum® могут быть автоматически скорректированы при изменении размера хранилища:
- Если значения не были заданы или не подходят новому размеру, будут применены настройки по умолчанию для этого размера.
- Если заданные вручную настройки подходят для нового размера, они не будут изменены.
Список настроек, зависящих от размера хранилища:
Настройки СУБД уровня кластера
Доступны следующие настройки:
-
Gp add column inherits table setting
Консоль управленияTerraformAPIОпределяет, применяются ли параметры сжатия данных (
compresstype,compresslevelиblocksize), указанные для AOCO-таблицы, при добавлении столбца.По умолчанию настройка выключена (параметры сжатия данных, заданные для таблицы, не учитываются).
Подробнее см. в документации Greenplum®
. -
Gp enable global deadlock detector
Консоль управленияTerraformAPIОпределяет, будет ли работать глобальный детектор взаимоблокировок. Он отслеживает наличие блокировок при параллельном выполнении операций
UPDATEиDELETEс heap-таблицами.По умолчанию настройка выключена. В этом случае операции
UPDATEиDELETEвыполняются последовательно, а не параллельно.Подробнее см. в документации Greenplum®
. -
Gp global deadlock detector period
Консоль управленияTerraformAPIЗадает периодичность (в секундах), с которой срабатывает глобальный детектор взаимоблокировок.
Минимальное значение —
5, по умолчанию —120.Подробнее см. в документации Greenplum®
. -
Gp workfile compression
Консоль управленияTerraformAPIОпределяет, будут ли сжаты временные файлы, созданные на диске в процессе хеш-соединения или агрегации хеша.
По умолчанию настройка выключена (временные файлы не сжимаются).
Подробнее см. в документации Greenplum®
.Важно
Изменение этой настройки приведет к поочередному перезапуску хостов кластера.
-
Gp workfile limits per query
Консоль управленияTerraformAPIМаксимальный объем дискового пространства (в байтах), который могут занимать временные файлы активного запроса в каждом сегменте.
Максимальное значение —
1099511627776(1 ТБ), минимальное —0(объем не ограничен), по умолчанию —0.Подробнее см. в документации Greenplum®
. -
Gp workfile limit files per query
Консоль управленияTerraformAPIМаксимальное количество временных файлов, которые сервис создает в сегменте для обработки одного запроса. Если этот предел превышен, запрос будет отменен.
Максимальное значение —
100000, минимальное —0(количество временных файлов не ограничено), по умолчанию —10000.Подробнее см. в документации Greenplum®
. -
Gp workfile limit per segment
Консоль управленияTerraformAPIМаксимальный объем дискового пространства (в байтах), который могут занимать временные файлы всех активных запросов в каждом сегменте.
Максимальное значение —
1099511627776(1 ТБ), минимальное —0(объем не ограничен). Значение по умолчанию зависит от размера хранилища хостов-сегментов и рассчитывается по формуле:0.1 × <размер_хранилища_хоста-сегмента> / <количество_сегментов_на_хост>Подробнее см. в документации Greenplum®
. -
Log connections
Консоль управленияОпределяет, выводить ли в лог строку с подробным описанием каждого успешного подключения к серверу Greenplum®.
По умолчанию настройка выключена (логирование не ведется).
Подробнее см. в документации Greenplum®
. -
Log disconnections
Консоль управленияОпределяет, логировать ли завершение сессий. Если настройка включена, то при завершении клиентской сессии в лог выводится строка, в которой указывается продолжительность сессии.
По умолчанию настройка выключена (логирование не ведется).
Подробнее см. в документации Greenplum®
. -
Log error verbosity
Консоль управленияЗадает уровень детализации информации в логе Greenplum® для каждого сообщения. Уровни детализации лога в порядке увеличения информативности:
terse.default(значение по умолчанию).verbose.
Подробнее см. в документации Greenplum®
. -
Log hostname
Консоль управленияОпределяет, выводить ли в лог подключений имя хоста главного сервера базы данных Greenplum®. Если настройка включена, то в лог выводятся IP-адрес и имя хоста. Если настройка выключена, то в лог выводится только IP-адрес.
По умолчанию настройка выключена.
Подробнее см. в документации Greenplum®
. -
Log min duration statement
Консоль управленияЗадает минимальное время работы команды (в миллисекундах), при котором команда будет записана в лог.
При значении
0логируется время работы всех команд.Минимальное значение —
-1(отключает логирование времени работы), максимальное значение —2147483647, по умолчанию —-1.Подробнее см. в документации Greenplum®
. -
Log min messages
Консоль управленияОпределяет уровень логирования Greenplum®. Записываются все сообщения выбранного уровня важности и выше. Возможные значения (по возрастанию важности):
DEBUG5,DEBUG4,DEBUG3,DEBUG2,DEBUG1,INFO,NOTICE,WARNING,ERROR,LOG,FATALиPANIC.По умолчанию используется
WARNING. Это означает, что в лог будут записаны все сообщения с уровнем важностиWARNING,ERROR,LOG,FATALиPANIC.Чтобы отключить запись большинства сообщений, выберите значение
PANIC.Подробнее см. в документации Greenplum®
. -
Log statement
Консоль управленияTerraformAPIФильтр команд SQL, которые будут записаны в лог Greenplum®:
NONE— фильтр отключен, команды SQL не записываются в лог.DDL— в лог записываются команды SQL, которые изменяют определения структур данных (CREATE,ALTER,DROPи т. п.).MOD— в лог записываются команды SQL, попадающие под фильтрDDL, и команды, позволяющие изменять данные (INSERT,UPDATE,DELETE,TRUNCATE, иCOPY FROM).ALL— в лог записываются все команды SQL.
Значение по умолчанию —
DDL.Выражения
PREPAREиEXPLAIN ANALYZEтакже записываются в лог, если содержат команды соответствующего типа.Подробнее см. в документации Greenplum®
. -
Log statement stats
Консоль управленияОпределяет, выводить ли статистику по запросам (разбор, планирование, выполнение) в лог.
По умолчанию настройка выключена (логирование не ведется).
Подробнее см. в документации Greenplum®
. -
Master shared buffers
Консоль управленияОбъем памяти, который хост-мастер Greenplum® использует для буферов общей памяти (в байтах).
Минимальное значение —
1048576(1 МБ). Значение по умолчанию —134217728(128 МБ).Максимальное значение рассчитывается по формуле:
min(<размер_хранилища_хоста-мастера> / 4, 8 * <размер_данных_в_базе>)Подробнее см. в документации Greenplum®
.Важно
Изменение этой настройки приведет к поочередному перезапуску хостов кластера.
-
Max connections
Консоль управленияTerraformAPIМаксимальное количество одновременных подключений к хосту-мастеру.
Максимальное значение —
1000, минимальное —50, по умолчанию —350. Для хостов-сегментов это значение автоматически умножается на пять.При увеличении значения этой настройки рекомендуется увеличить также Max prepared transactions.
При изменении настройки проводится проверка, что объем доступной оперативной памяти на одно подключение (как на мастере, так и на сегменте) будет составлять не меньше 20 МБ. Если это условие не выполняется, возникает ошибка.
Подробнее см. в документации Greenplum®
. -
Max prepared transactions
Консоль управленияTerraformAPIМаксимальное количество транзакций, которые могут одновременно находиться в подготовленном состоянии
.Максимальное значение —
10000, минимальное —350, по умолчанию —350. Значения для хостов-мастеров и хостов-сегментов совпадают.Для настройки не рекомендуется выбирать значение ниже, чем у Max connections.
Подробнее см. в документации Greenplum®
. -
Max slot wal keep size
Консоль управленияTerraformAPIМаксимальный размер (в байтах) файлов лога WAL
(Write-Ahead Log) при репликации.Минимальное значение —
0(лог не ведется), максимальное —214748364800(200 ГБ). Значение по умолчанию зависит от размера хранилища хостов-сегментов и рассчитывается по формуле:0.1 × <размер_хранилища_хоста-сегмента> / <количество_сегментов_на_хост>Подробнее см. в документации Greenplum®
. -
Max statement mem
Консоль управленияTerraformAPIМаксимальный объем памяти (в байтах), выделяемый для обработки запроса.
Минимальное значение —
134217728(128 МБ), максимальное —1099511627776(1 ТБ), по умолчанию —2097152000(2000 МБ).Подробнее см. в документации Greenplum®
. -
Segment shared buffers
Консоль управленияОбъем памяти, который хосты-сегменты Greenplum® используют для буферов общей памяти (в байтах).
Минимальное значение —
1048576(1 МБ). Значение по умолчанию —134217728(128 МБ).Максимальное значение рассчитывается по формуле:
min(<размер_хранилища_хоста-сегмента> / (4 * <количество_сегментов_на_хост>), 8 * <размер_данных_в_базе>)Подробнее см. в документации Greenplum®
.Важно
Изменение этой настройки приведет к поочередному перезапуску хостов кластера.
Настройки внешнего источника данных S3
Доступны следующие настройки:
-
Access Key
Консоль управленияCLIAPIПубличный ключ доступа к S3-хранилищу.
Подробнее см. в документации Greenplum®
. -
Secret Key
Консоль управленияCLIAPIСекретный ключ доступа к S3-хранилищу.
Подробнее см. в документации Greenplum®
. -
Fast Upload
Консоль управленияCLIAPIУправляет быстрой загрузкой больших файлов в S3-хранилище. Если настройка выключена, PXF формирует файлы на диске перед отправкой в S3-хранилище. Если настройка включена, PXF формирует файлы в оперативной памяти (если ее не хватает, то записывает на диск).
По умолчанию быстрая загрузка включена.
Подробнее см. в документации Greenplum®
. -
Endpoint
Консоль управленияCLIAPIАдрес S3-хранилища. Значение для Yandex Object Storage —
storage.yandexcloud.net. Это значение используется по умолчанию.Подробнее см. в документации Greenplum®
.
Настройки внешнего источника данных JDBC
Доступны следующие настройки:
-
Driver
Консоль управленияCLIAPIКласс JDBC-драйвера в Java. Возможные значения:
com.simba.athena.jdbc.Drivercom.clickhouse.jdbc.ClickHouseDrivercom.ibm.as400.access.AS400JDBCDrivercom.microsoft.sqlserver.jdbc.SQLServerDrivercom.mysql.cj.jdbc.Driverorg.postgresql.Driveroracle.jdbc.driver.OracleDrivernet.snowflake.client.jdbc.SnowflakeDriverio.trino.jdbc.TrinoDriver
Подробнее см. в документации Greenplum®
. -
Url
Консоль управленияCLIAPIURL базы данных. Примеры:
jdbc:mysql://mysqlhost:3306/testdb— для локальной БД MySQL®.jdbc:postgresql://c-<идентификатор_кластера>.rw.mdb.yandexcloud.net:6432/db1— для кластера Yandex Managed Service for PostgreSQL. Адрес содержит особый FQDN мастера в кластере.jdbc:oracle:thin:@host.example:1521:orcl— для БД Oracle.
Подробнее см. в документации Greenplum®
. -
User
Консоль управленияCLIAPIИмя пользователя, владельца БД.
Подробнее см. в документации Greenplum®
. -
Password
Консоль управленияCLIAPIПароль пользователя БД.
Подробнее см. в документации Greenplum®
. -
Statement Batch Size
Консоль управленияCLIAPIКоличество строк в пакете для чтения из внешней таблицы.
Значение по умолчанию —
100.Подробнее см. в документации Greenplum®
. -
Statement Fetch Size
Консоль управленияCLIAPIКоличество строк, которые нужно поместить в буфер при чтении из внешней таблицы.
Значение по умолчанию —
1000.Подробнее см. в документации Greenplum®
. -
Statement Query Timeout
Консоль управленияCLIAPIВремя (в секундах), в течение которого драйвер JDBC ожидает выполнения операции чтения или записи.
Значение по умолчанию —
60.Подробнее см. в документации Greenplum®
. -
Pool Enabled
Консоль управленияCLIAPIОпределяет, используется ли пул подключений JDBC. По умолчанию используется.
Подробнее см. в документации Greenplum®
. -
Pool Maximum Size
Консоль управленияCLIAPIМаксимальное количество подключений к серверу базы данных.
Значение по умолчанию —
5.Подробнее см. в документации Greenplum®
. -
Pool Connection Timeout
Консоль управленияCLIAPIМаксимальное время (в миллисекундах) для ожидания подключения из пула.
Значение по умолчанию —
30000.Подробнее см. в документации Greenplum®
. -
Pool Idle Timeout
Консоль управленияCLIAPIМаксимальное время (в миллисекундах), по истечении которого неактивное соединение считается простаивающим.
Значение по умолчанию —
30000.Подробнее см. в документации Greenplum®
. -
Pool Minimum Idle
Консоль управленияCLIAPIМинимальное количество простаивающих подключений в пуле.
Значение по умолчанию —
0.Подробнее см. в документации Greenplum®
.
Настройки внешнего источника данных HDFS
Доступны следующие настройки:
-
Core
Консоль управленияAPIНастройки файловой системы и правил безопасности.
Подробнее см. в документации Apache Hadoop
.-
Default Fs
URI, который определяет файловую систему HDFS.
-
Security Auth To Local
Правила сопоставления участников Kerberos с учетными записями пользователей операционной системы.
-
-
Kerberos
Консоль управленияAPIНастройки сетевого протокола аутентификации Kerberos.
Подробнее см. в документации Greenplum®
.-
Enable
Определяет, будет ли использоваться сервер аутентификации Kerberos. По умолчанию не используется.
-
Primary
Хост основного сервера KDC (Key Distribution Center).
-
Realm
Область Kerberos для базы данных Greenplum®.
-
Kdc Servers
Хосты серверов KDC.
-
Admin server
Хост сервера администрирования. Обычно это основной сервер Kerberos.
-
Default domain
Домен, который используется для расширения имен хостов. Применим, когда участники-службы Kerberos 4 становятся участниками-службами Kerberos 5 (например, rcmd.hostname заменяется на host/hostname.domain).
-
Keytab Base64
Содержимое keytab-файла в кодировке Base64.
-
-
User Impersonation
Консоль управленияAPIОпределяет, можно ли аутентифицироваться во внешнем файловом хранилище или СУБД от лица пользователя Greenplum®.
По умолчанию аутентификация запрещена.
Подробнее см. в документации Greenplum®
. -
Username
Консоль управленияAPIИмя пользователя, с помощью которого выполняется подключение к внешнему файловому хранилищу или СУБД, если аутентификация от имени другого пользователя отключена.
Подробнее см. в документации Greenplum®
. -
Sasl Connection Retries
Консоль управленияAPIМаксимальное количество повторных попыток PXF выполнить запрос на подключение SASL, если возникла ошибка
GSS initiate failed.Значение по умолчанию —
5.Подробнее см. в документации Greenplum®
. -
ZK Hosts
Консоль управленияAPIХосты серверов ZooKeeper. Значения указываются в формате
<адрес>:<порт>.Подробнее см. в документации Apache Hadoop
.
-
Dfs
Консоль управленияAPIНастройки распределенной файловой системы.
Подробнее см. в документации Apache Hadoop
.-
Ha Automatic Failover Enabled
Определяет, включена ли автоматическая отказоустойчивость для высокой доступности файловой системы. По умолчанию включена.
-
Block Access Token Enabled
Определяет, используются ли токены доступа. По умолчанию токены проверяются во время подключений к узлам для хранения данных (datanodes).
-
Use Datanode Hostname
Определяет, используются ли имена узлов для хранения данных (datanodes) при подключении к этим узлам. По умолчанию используются.
-
Nameservices
Список логических имен HDFS-служб. Имена могут быть произвольными, разделяются запятыми.
-
-
Yarn
Консоль управленияAPIНастройки службы ResourceManager, которая отслеживает ресурсы в кластере и планирует запуск приложений (например, заданий MapReduce).
Подробнее см. в документации Apache Hadoop
.-
Resourcemanager Ha Enabled
Определяет, включена ли высокая доступность для ResourceManager. По умолчанию включена.
-
Resourcemanager Ha Auto Failover Enabled
Определяет, включен ли автоматический переход на другой ресурс, если активная служба вышла из строя или не отвечает. По умолчанию автоматический переход включен, только если включена настройка Resourcemanager Ha Enabled.
-
Resourcemanager Ha Auto Failover Embedded
Определяет, использовать ли встроенный метод ActiveStandbyElector для выбора активной службы. Если текущая активная служба вышла из строя или не отвечает, ActiveStandbyElector делает активной другую службу ResourceManager, которая берет управление на себя.
По умолчанию настройка включена, только если включены настройки Resourcemanager Ha Enabled и Resourcemanager Ha Auto Failover Enabled.
-
Resourcemanager Cluster Id
Идентификатор кластера. Используется, чтобы служба ResourceManager не стала активной для другого кластера.
-
Настройки внешнего источника данных Hive
Доступны следующие настройки:
-
Core
Консоль управленияAPIНастройки файловой системы и правил безопасности.
Подробнее см. в документации Apache Hadoop
.-
Default Fs
URI, который определяет файловую систему HDFS.
-
Security Auth To Local
Правила сопоставления участников Kerberos с учетными записями пользователей операционной системы.
-
-
Kerberos
Консоль управленияAPIНастройки сетевого протокола аутентификации Kerberos.
Подробнее см. в документации Greenplum®
.-
Enable
Определяет, будет ли использоваться сервер аутентификации Kerberos. По умолчанию не используется.
-
Primary
Хост основного сервера KDC (Key Distribution Center).
-
Realm
Область Kerberos для базы данных Greenplum®.
-
Kdc Servers
Хосты серверов KDC.
-
Admin server
Хост сервера администрирования. Обычно это основной сервер Kerberos.
-
Default domain
Домен, который используется для расширения имен хостов. Применим, когда участники-службы Kerberos 4 становятся участниками-службами Kerberos 5 (например, rcmd.hostname заменяется на host/hostname.domain).
-
Keytab Base64
Содержимое keytab-файла в кодировке Base64.
-
-
User Impersonation
Консоль управленияAPIОпределяет, можно ли аутентифицироваться во внешнем файловом хранилище или СУБД от лица пользователя Greenplum®.
По умолчанию аутентификация запрещена.
Подробнее см. в документации Greenplum®
. -
Username
Консоль управленияAPIИмя пользователя, с помощью которого выполняется подключение к внешнему файловому хранилищу или СУБД, если аутентификация от имени другого пользователя отключена.
Подробнее см. в документации Greenplum®
. -
Sasl Connection Retries
Консоль управленияAPIМаксимальное количество повторных попыток PXF выполнить запрос на подключение SASL, если возникла ошибка
GSS initiate failed.Значение по умолчанию —
5.Подробнее см. в документации Greenplum®
. -
ZK Hosts
Консоль управленияAPIХосты серверов ZooKeeper. Значения указываются в формате
<адрес>:<порт>.Подробнее см. в документации Apache Hadoop
.
-
Ppd
Консоль управленияAPIОпределяет, включено ли выталкивание предикатов (predicate pushdown) для запросов к внешним таблицам. По умолчанию включено.
Подробнее см. в документации Greenplum®
. -
Metastore Uris
Консоль управленияAPIСписок URI, разделенных запятыми. Чтобы запросить метаданные, внешняя СУБД подключается к Metastore по одному из этих URI.
-
Metastore Kerberos Principal
Консоль управленияAPIУчастник службы для сервера Metastore Thrift.
-
Auth Kerberos Principal
Консоль управленияAPIУчастник сервера Kerberos.