Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Managed Service for PostgreSQL
  • Начало работы
    • Все инструкции
      • Просмотр логов кластера
      • Мониторинг состояния кластера и хостов
      • Подключение к DataLens
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Мониторинг состояния кластера
  • Мониторинг состояния хостов
  • Настройка алертов в Yandex Monitoring
  • Состояние и статус кластера
  • Состояния кластера
  • Статусы кластера
  1. Пошаговые инструкции
  2. Логи и мониторинг
  3. Мониторинг состояния кластера и хостов

Мониторинг состояния кластера PostgreSQL и хостов

Статья создана
Yandex Cloud
Обновлена 22 декабря 2025 г.
  • Мониторинг состояния кластера
  • Мониторинг состояния хостов
  • Настройка алертов в Yandex Monitoring
  • Состояние и статус кластера
    • Состояния кластера
    • Статусы кластера

Данные о состоянии кластера и его хостов доступны в консоли управления. Их можно посмотреть на вкладке Мониторинг страницы управления кластером или в сервисе Yandex Monitoring.

Диагностическая информация о состоянии кластера представлена в виде графиков.

Период обновления графиков:

  • Для хостов стандартной конфигурации и хостов с увеличенным соотношением количества гигабайт RAM к количеству vCPU (memory-optimized): 15 секунд.
  • Для хостов с гарантированной долей vCPU ниже 100% (burstable): 150 секунд.

Примечание

На графиках автоматически применяются наиболее подходящие кратные единицы измерения (мегабайты, гигабайты и т. д.).

Вы можете настроить алерты в сервисе Yandex Monitoring для получения уведомлений о сбоях в работе кластера. В Yandex Monitoring используются два порога срабатывания алерта: Warning и Alarm. При превышении заданного порога вы получите оповещения через настроенные каналы уведомлений.

Мониторинг состояния кластераМониторинг состояния кластера

Для просмотра детальной информации о состоянии кластера Managed Service for PostgreSQL:

  1. Перейдите в сервис Managed Service for PostgreSQL.

  2. Нажмите на имя нужного кластера и выберите вкладку Мониторинг.

  3. Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в Monitoring на панели сверху.

На странице появятся следующие графики:

  • В блоке Cluster:

    • PostgreSQL Alive, [boolean] — работоспособность PostgreSQL, для каждого хоста в каждой из ролей: мастера и реплики.

    • Is Primary, [boolean] — показывает, какой хост является мастером и как долго.

    • Replication lag — время задержки репликации.

      Важно

      Время задержки репликации рассчитывается с точностью до одной секунды. Если задержка меньше одной секунды, ее невозможно отследить с помощью этой метрики.

    • Average CPU usage — среднее время обработки транзакций и выполнения операторов.

    • Maximum CPU usage — пиковая загрузка процессорных ядер.

    • Maximum memory usage — пиковое использование оперативной памяти (в байтах). При высоких нагрузках значение параметра Free уменьшается, остальные — растут.

    • Log errors — количество логированных ошибок в секунду.

    • OOM Count — наличие процессов Out-Of-Memory Killer. Они останавливают приложения, которые расходуют всю память на машине, и предотвращают аварийную остановку ОС.

  • В блоке Disk:

    • Disk usage on primary — использование дискового пространства на хосте-мастере (в байтах).
    • Disk read/write bytes — скорость дисковых операций чтения и записи (байт/с).
    • Disk read/write IOPS — интенсивность дисковых операций чтения и записи (операций/с).
    • Disk usage by DB — использование дискового пространства по базам данных (в байтах).
    • Inode usage on primary — использованное количество inode на хосте-мастере.
    • Inode usage by host — использованное количество inode по хостам.
    • Total size of temporary files — суммарный размер временных файлов (в байтах).
    • Total size of WAL files — суммарный размер файлов WAL (в байтах).
    • Free space — свободное дисковое пространство для каждого хоста (в байтах).
    • WAL rate in bytes — скорость записи файлов WAL в байтах в секунду.
  • В блоке Transactions:

    • Transactions/statements per second — количество транзакций и операторов в секунду.
    • Average transaction/statement time — среднее время обработки транзакций и выполнения операторов.
    • Age of oldest transaction/statement — возраст самой старой транзакции/запроса.
    • Statement quantiles — время выполнения операторов по процентилям.
    • Transaction quantiles — время обработки транзакций по процентилям.
    • Used/Free Transaction IDs — используемые/свободные идентификаторы транзакций
    • Transaction IDs left — остаток доступных идентификаторов транзакций.
  • В блоке Vacuum:

    • Vacuum processes — количество процессов, выполняющих операцию вакуумирования.
    • Scanning progress — прогресс сканирования в процессе вакуумирования.
    • Vacuuming progress — прогресс выполнения операции вакуумирования.
  • В блоке Sessions:

    • Sessions read bytes per second — объем прочитанных данных по видам сессий (в байтах).
    • Sessions write bytes per second — объем записанных данных по видам сессий (в байтах).
    • Session CPU usage cores — количество занятых процессорных ядер по видам сессий.
    • Sessions per wait event — количество ожидающих сессий по видам ожидания.
  • В блоке Connections:

    • Pooler is alive, [boolean] — работоспособность менеджера подключений, для каждого хоста в каждой из ролей: мастера и реплики.
    • Total pooler connections — количество подключений в менеджере подключений: клиентских и серверных.
    • TCP connections — количество TCP-подключений в секунду.
  • В блоке Network:

    • Packets received/sent — интенсивность обмена данными по сети (пакетов/с).
    • Network received/sent bytes — скорость обмена данными по сети (байт/с).

Мониторинг состояния хостовМониторинг состояния хостов

Для просмотра детальной информации о состоянии отдельных хостов Managed Service for PostgreSQL:

  1. Перейдите в сервис Managed Service for PostgreSQL.
  2. Нажмите на имя нужного кластера и выберите вкладку Хосты.
  3. Нажмите на строку нужного хоста в списке.

На этой странице выводятся графики, показывающие нагрузку на отдельный хост кластера:

  • CPU usage — загрузка процессорных ядер. При повышении нагрузки значение Idle уменьшается.
  • Memory usage — использование оперативной памяти (в байтах). При высоких нагрузках значение параметра Free уменьшается, остальные — растут.
  • Disk usage — использование дискового пространства (в байтах).
  • Disk usage by DB — использование дискового пространства по базам данных (в байтах).
  • Disk read/write bytes — скорость дисковых операций (байт/с).
  • Disk IOPS — интенсивность дисковых операций (операций/с).
  • Network Packets — интенсивность обмена данными по сети (пакетов/с).
  • Network Bytes — скорость обмена данными по сети (байт/с).

На графиках Disk read/write bytes и Disk IOPS характеристика Read растет при активном чтении из базы данных, а Write — при записи в нее.

Для хостов с ролью Replica нормально преобладание Received над Sent на графиках Network Bytes и Network Packets.

Настройка алертов в Yandex MonitoringНастройка алертов в Yandex Monitoring

Консоль управления
  1. В консоли управления выберите каталог с кластером, для которого нужно настроить алерты.
  2. Перейдите в сервис  Monitoring.
  3. В блоке Сервисные дашборды выберите:
    • Managed Service for PostgreSQL — Cluster Overview для настройки алертов кластера;
    • Managed Service for PostgreSQL — Host Overview для настройки алертов хостов.
  4. На нужном графике нажмите на значок и выберите пункт Создать алерт.
  5. Если на графике несколько показателей, выберите запрос данных для формирования метрики и нажмите Продолжить. Подробнее о языке запросов см. документацию Yandex Monitoring.
  6. Задайте значения порогов Alarm и Warning для срабатывания алерта.
  7. Нажмите кнопку Создать алерт.

Чтобы настроить автоматический мониторинг других показателей состояния кластера:

Консоль управления
  1. Создайте алерт.
  2. Добавьте метрику состояния.
  3. В параметрах алерта задайте значения порогов для оповещения.

Рекомендуемые значения порогов для некоторых метрик:

Метрика Обозначение Alarm Warning
Задержка репликации postgres-replication_lag 60 5
Количество работоспособных хостов postgres-is_alive <количество_хостов> - 2 <количество_хостов> - 1
Среднее время выполнения запросов pooler-avg_query_time — 2000
Размер использованного хранилища disk.used_bytes 90% от размера хранилища 80% от размера хранилища

Для метрики disk.used_bytes значения порогов Alarm и Warning задаются только в байтах. Например, рекомендуемые значения для диска размером в 100 ГБ:

  • Alarm — 96636764160 байтов (90%).
  • Warning — 85899345920 байтов (80%).

Текущий размер хранилища можно посмотреть в детальной информации о кластере. Полный список поддерживаемых метрик см. в документации Monitoring.

Состояние и статус кластераСостояние и статус кластера

Состояние кластера указывает на исправность его хостов, а Статус показывает, запущен кластер, остановлен или находится в промежуточном состоянии.

Для просмотра состояния и статуса кластера:

  1. Перейдите на страницу каталога и выберите Managed Service for PostgreSQL.
  2. Наведите курсор на индикатор в столбце Доступность в строке нужного кластера.

Состояния кластераСостояния кластера

Состояние Описание Предлагаемые действия
ALIVE Кластер работает в штатном режиме. Действий не требуется.
DEGRADED Кластер работает не на полную мощность: минимум один из хостов имеет состояние, отличное от ALIVE. Выполните диагностику:
  • Перейдите на вкладку Хосты и посмотрите, какие из них в нерабочем состоянии.
  • Перейдите на вкладку Операции и убедитесь, что все операции завершились.
  • Убедитесь, что кластер не находится в процессе технического обслуживания.
Если причины не удалось выяснить самостоятельно, обратитесь в службу поддержки.
DEAD Кластер неработоспособен: ни один его хост не работает. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние DEAD.
UNKNOWN Состояние кластера неизвестно. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние UNKNOWN.

Статусы кластераСтатусы кластера

Статус Описание Предлагаемые действия
CREATING Идет подготовка к первому запуску Подождите немного и приступайте к работе. Время создания кластера зависит от класса хостов.
RUNNING Кластер работает в штатном режиме Действий не требуется.
STOPPING Кластер останавливается Через некоторое время кластеру будет присвоен статус STOPPED, и он будет выведен из работы. Действий не требуется.
STOPPED Кластер остановлен Запустите кластер, чтобы вернуть его в работу.
STARTING Остановленный ранее кластер запускается Через некоторое время кластеру будет присвоен статус RUNNING. Подождите немного и приступайте к работе.
UPDATING Обновляется конфигурация кластера По завершении обновления кластеру будет присвоен статус, который был до обновления: RUNNING или STOPPED.
ERROR Произошла ошибка при выполнении операции с кластером или во время окна технического обслуживания Если кластер долго находится в этом статусе, обратитесь в службу поддержки. Доступность кластера можно определить по его состоянию.
STATUS_UNKNOWN Кластер не может определить свой статус Если кластер долго находится в этом статусе, обратитесь в службу поддержки.

Была ли статья полезна?

Предыдущая
Просмотр логов кластера
Следующая
Подключение к DataLens
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»