Мониторинг состояния кластера Greenplum® и хостов
Данные о состоянии кластера и его хостов доступны в консоли управления. Их можно посмотреть на вкладке Мониторинг страницы управления кластером или в сервисе Yandex Monitoring.
Диагностическая информация о состоянии кластера представлена в виде графиков.
Новые данные для графиков поступают каждые 15 секунд.
Примечание
На графиках автоматически применяются наиболее подходящие кратные единицы измерения (мегабайты, гигабайты и т. д.).
Мониторинг состояния кластера
Для просмотра детальной информации о состоянии кластера Managed Service for Greenplum®:
- Перейдите на страницу каталога
и выберите сервис Managed Service for Greenplum. - Нажмите на имя нужного кластера и выберите вкладку
Мониторинг. -
Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в Monitoring на панели сверху.
На странице отображаются следующие графики:
-
Alive hosts — работоспособность хостов кластера.
-
Alive segments — работоспособность первичного и резервного мастеров, основных и зеркальных сегментов.
-
Connections — количество подключений к БД в каждом из состояний:
- Active — активные;
- Waiting — ожидают;
- Idle — простаивают;
- Idle in transaction — простаивают в транзакции;
- Aborted — прерванные.
-
Group resource cpu — загрузка процессорных ядер по группам процессов:
- admin_group — в административной группе;
- default_group — в группе по умолчанию.
-
Group resource memory — использование оперативной памяти (в байтах) по группам процессов:
- admin_group — в административной группе;
- default_group — в группе по умолчанию.
-
Master — определение первичного хоста-мастера.
-
Master replication lag — отставание репликации мастера (в байтах).
-
Master replication state — работоспособность репликации мастера.
-
Segment health — количество сегментов с различной работоспособностью:
- total — все;
- not sync — несинхронизированные;
- down — недоступные;
- not prefer role — непредпочтительные.
-
Spill files count — количество временных файлов.
-
Spill files size — суммарный размер временных файлов (в байтах).
-
Xid wraparound — использование последовательности идентификаторов транзакций
(в процентах). -
Background activities — группа графиков, показывающих информацию о фоновых процессах:
-
Tables vacuum age — количество пользовательских таблиц, очистка которых выполнялась N дней назад.
-
Tables analyze age — количество пользовательских таблиц, сбор статистики для которых выполнялся N дней назад.
-
Expansion progress — ход процесса перераспределения данных при расширении кластера:
- Tables — процент обработанных таблиц.
- Bytes — процент перераспределенных байт данных.
Примечание
Этот график показывает ход процесса, даже если перераспределение данных было запущено не в виде фонового процесса.
-
Мониторинг состояния хостов
Для просмотра детальной информации о состоянии отдельных хостов Managed Service for Greenplum®:
- Перейдите на страницу каталога
и выберите сервис Managed Service for Greenplum. - Нажмите на имя нужного кластера и выберите вкладку
Хосты → Мониторинги. - Выберите нужный хост из выпадающего списка.
На этой странице выводятся графики, показывающие нагрузку на отдельный хост кластера (мастер или сегмент):
- CPU — загрузка процессорных ядер. При повышении нагрузки значение
Idle
уменьшается. - Disk IOPS in progress — количество незавершенных дисковых операций.
- Disk io time — длительность дисковых операций.
- Disk read and write — объем дисковых операций (в байтах).
- Disk read and write time — длительность дисковых операций чтения и записи.
- Disk usage — использование дискового пространства (выводится два графика: в байтах и в процентах).
- Memory usage — использование оперативной памяти (в байтах). При высоких нагрузках значение параметра
Free
уменьшается, а значения остальных — растут. - Network — объем данных, переданных по сети (в байтах).
Интеграция с Yandex Monitoring
Чтобы настроить алерты показателей состояния кластера и хостов:
- В консоли управления
выберите каталог с кластером, для которого нужно настроить алерты. - В списке сервисов выберите
Monitoring. - В блоке Сервисные дашборды выберите:
- Managed Service for Greenplum® — Cluster Overview для настройки алертов кластера;
- Managed Service for Greenplum® — Host Overview для настройки алертов хостов.
- На нужном графике с показателями нажмите на значок
и выберите пункт Создать алерт. - Если показателей на графике больше одного, выберите запрос данных для формирования метрики и нажмите Продолжить. Подробнее о языке запросов см. в документации Yandex Monitoring.
- Задайте значения порогов
Alarm
иWarning
для оповещения. - Нажмите кнопку Создать алерт.
Чтобы настроить автоматический мониторинг других показателей состояния кластера:
- Создайте алерт.
- Добавьте метрику состояния.
- Задайте значения порогов для оповещения в параметрах алерта.
Полный список поддерживаемых метрик см. в документации Monitoring.
Состояние и статус кластера
Состояние кластера указывает на исправность его хостов, а Статус показывает, запущен кластер, остановлен или находится в промежуточном состоянии.
Для просмотра состояния и статуса кластера:
- Перейдите на страницу каталога
и выберите сервис Managed Service for Greenplum. - Наведите курсор на индикатор в столбце Доступность в строке нужного кластера.
Состояния кластера
Состояние | Описание | Предлагаемые действия |
---|---|---|
ALIVE | Кластер работает в штатном режиме. | Действий не требуется. |
DEGRADED | Кластер работает не на полную мощность: минимум один из хостов имеет состояние, отличное от ALIVE . |
Выполните диагностику:
|
DEAD | Кластер неработоспособен: ни один его хост не работает. | Составьте обращение в службу поддержки
|
UNKNOWN | Состояние кластера неизвестно. | Составьте обращение в службу поддержки
|
Статусы кластера
Статус | Описание | Предлагаемые действия |
---|---|---|
CREATING | Идет подготовка к первому запуску | Подождите немного и приступайте к работе. Время создания кластера зависит от класса хостов. |
RUNNING | Кластер работает в штатном режиме | Действий не требуется. |
STOPPING | Кластер останавливается | Через некоторое время кластеру будет присвоен статус STOPPED , и он будет выведен из работы. Действий не требуется. |
STOPPED | Кластер остановлен | Запустите кластер, чтобы вернуть его в работу. |
STARTING | Остановленный ранее кластер запускается | Через некоторое время кластеру будет присвоен статус RUNNING . Подождите немного и приступайте к работе. |
UPDATING | Выполняется обновление состояния кластера | По завершении обновления ему будет присвоен статус RUNNING . Подождите немного и приступайте к работе. |
ERROR | Произошла ошибка, которая не позволяет кластеру продолжить работу | Выполните начальную диагностику:
|
STATUS_UNKNOWN | Кластер не может определить свой статус | Выполните начальную диагностику:
|
Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками VMware, Inc в США и/или других странах.