Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Managed Service for ClickHouse®
  • Начало работы
    • Все инструкции
      • Просмотр логов кластера
      • Мониторинг состояния кластера и хостов
      • Подключение из DataLens
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Yandex Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Мониторинг состояния кластера
  • Доступные графики
  • Мониторинг состояния хостов
  • Настройка алертов в Yandex Monitoring
  • Состояние и статус кластера
  • Состояния кластера
  • Статусы кластера
  1. Пошаговые инструкции
  2. Логи и мониторинг
  3. Мониторинг состояния кластера и хостов

Мониторинг состояния кластера ClickHouse® и его хостов

Статья создана
Yandex Cloud
Обновлена 27 ноября 2025 г.
  • Мониторинг состояния кластера
    • Доступные графики
  • Мониторинг состояния хостов
  • Настройка алертов в Yandex Monitoring
  • Состояние и статус кластера
    • Состояния кластера
    • Статусы кластера

Данные о состоянии кластера и его хостов доступны в консоли управления. Их можно посмотреть на вкладке Мониторинг страницы управления кластером или в сервисе Yandex Monitoring.

Диагностическая информация о состоянии кластера представлена в виде графиков.

Период обновления графиков:

  • Для хостов стандартной конфигурации и хостов с увеличенным соотношением количества гигабайт RAM к количеству vCPU (memory-optimized): 15 секунд.
  • Для хостов с гарантированной долей vCPU ниже 100% (burstable): 150 секунд.

Примечание

На графиках автоматически применяются наиболее подходящие кратные единицы измерения (мегабайты, гигабайты и т. д.).

Вы можете настроить алерты в сервисе Yandex Monitoring для получения уведомлений о сбоях в работе кластера. В Yandex Monitoring используются два порога срабатывания алерта: Warning и Alarm. При превышении заданного порога вы получите оповещения через настроенные каналы уведомлений.

Мониторинг состояния кластераМониторинг состояния кластера

Для просмотра детальной информации о состоянии кластера Managed Service for ClickHouse®:

Консоль управления
  1. В консоли управления выберите каталог, в котором находится кластер.

  2. Перейдите в сервис Managed Service for ClickHouse.

  3. Нажмите на имя нужного кластера и выберите вкладку Мониторинг.

    На открывшейся странице будут отображены графики работы кластера и хостов ClickHouse®.

  4. Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в Monitoring на панели сверху.

Доступные графикиДоступные графики

Если кластер состоит из хостов ClickHouse® и ZooKeeper, на странице Мониторинг доступны вкладки:

  • ClickHouse — информация о состоянии всего кластера и хостов ClickHouse®.
  • ZooKeeper — информация о состоянии хостов ZooKeeper.

Если кластер состоит только из хостов ClickHouse®, на странице Мониторинг доступна вкладка Кластеры с информацией, соответствующей вкладке ClickHouse.

При любой конфигурации кластера на странице Мониторинг также доступна вкладка Хосты для просмотра детальной информации о состоянии хостов.

ClickHouse
ZooKeeper

На вкладке отображаются графики:

  • В блоке Summary:

    • Select queries — количество запросов выборки в секунду для кластера.
    • Insert queries — количество запросов вставки в секунду для кластера.
    • Total queries — общее количество запросов в секунду для кластера.
    • Inserted data — скорость вставки данных для кластера.
    • Read data — скорость чтения данных для кластера.
    • Merged data — скорость слияния данных для кластера.
    • CPU usage — количество используемых процессорных ядер в подкластере ClickHouse®.
    • Memory usage — использование оперативной памяти в подкластере ClickHouse®.
    • Disk space usage — занятое дисковое пространство в подкластере ClickHouse®.
  • В блоке Queries:

    • Select queries per host — количество запросов выборки в секунду для каждого хоста в кластере.
    • Insert queries per host — количество запросов вставки в секунду для каждого хоста в кластере.
    • Total queries per host — общее количество запросов в секунду для каждого хоста в кластере.
    • Failed select queries per host — процент неуспешных запросов выборки для каждого хоста в подкластере ClickHouse®.
    • Failed insert queries per host — процент неуспешных запросов вставки для каждого хоста в подкластере ClickHouse®.
    • Failed queries per host — процент неуспешных запросов для каждого хоста в подкластере ClickHouse®.
    • Average select query time per host — среднее время выполнения запросов выборки для каждого хоста в подкластере ClickHouse®.
    • Average insert query time per host — среднее время выполнения запросов вставки для каждого хоста в подкластере ClickHouse®.
    • Average query time per host — среднее время выполнения запросов для каждого хоста в подкластере ClickHouse®.
  • В блоке Connections and Locks:

    • Connections per host — количество подключений для каждого хоста в кластере.
    • Active locks per host — количество активных блокировок для каждого хоста в кластере.
    • Waiting locks per host — количество ожидающих блокировок для каждого хоста в кластере.
  • В блоке Data Traffic:

    • Read data per host — скорость чтения данных для каждого хоста в кластере.
    • Inserted data per host — скорость вставки данных для каждого хоста в кластере.
    • Merged data per host — скорость слияния данных для каждого хоста в кластере.
    • Read rows per host — скорость чтения строк в секунду для каждого хоста в кластере.
    • Inserted rows per host — скорость вставки строк в секунду для каждого хоста в кластере.
    • Merged rows per host — скорость слияния строк в секунду для каждого хоста в кластере.
  • В блоке Storage:

    • Disk space usage per host, bytes — занятое дисковое пространство для каждого хоста в подкластере ClickHouse®.
    • Disk space usage per host, % — процент использования дискового пространства для каждого хоста в подкластере ClickHouse®.
    • Inode usage, % — процент использованния inode для каждого хоста в подкластере ClickHouse®.
    • Databases — количество баз данных для каждого хоста в кластере.
    • Tables — количество таблиц для каждого хоста в кластере.
    • Rows of MergeTree tables — количество строк в таблицах семейства MergeTree для каждого хоста в кластере.
    • Data parts — количество кусков данных для каждого хоста в кластере.
    • Detached data parts — количество отдельных кусков данных для каждого хоста в кластере.
  • В блоке Replication and Background Data Processing:

    • Max replication delay across tables — максимальная задержка репликации таблиц для каждого хоста в кластере. Значения больше нескольких секунд могут указывать на чрезмерную нагрузку или проблемы в работе репликации.
    • Replication queue — размер очереди репликации для каждого хоста в кластере.
    • Max data parts per partition — максимальное количество кусков данных в партиции для каждого хоста в кластере. Лимит для этой величины определяется настройками СУБД. Приближение к лимиту указывает на чрезмерную нагрузку или низкую эффективность вставки данных.
    • Merges and mutations pool tasks — количество активных задач слияния и мутаций в фоновом пуле для каждого хоста в подкластере ClickHouse®.
    • Fetches pool tasks — количество активных задач извлечения в фоновом пуле для каждого хоста в подкластере ClickHouse®.
    • Move pool tasks — количество активных задач перемещения в фоновом пуле для каждого хоста в подкластере ClickHouse®.
  • В блоке System Resources:

    • CPU usage per host, cores — количество используемых процессорных ядер для каждого хоста в подкластере ClickHouse®.
    • Memory usage per host, bytes — использование оперативной памяти для каждого хоста в подкластере ClickHouse®.
    • CPU usage per host, % — процент использования процессорных ядер для каждого хоста в подкластере ClickHouse®.
    • Memory usage per host, % — процент использования оперативной памяти для каждого хоста в подкластере ClickHouse®.
    • Disk read per host — скорость чтения с диска для каждого хоста в подкластере ClickHouse®.
    • Disk write per host — скорость записи на диск для каждого хоста в подкластере ClickHouse®.
    • Disk usage per host — скорость дисковых операций для каждого хоста в подкластере ClickHouse®.
    • Network data received per host — скорость приема данных из сети для каждого хоста в подкластере ClickHouse®.
    • Network data sent per host — скорость отправки данных в сеть для каждого хоста в подкластере ClickHouse®.
    • Network usage per host — скорость обмена данными по сети для каждого хоста в подкластере ClickHouse®.

На вкладке отображаются графики:

  • Transactions — количество транзакций в секунду.
  • Outstanding requests per ZooKeeper host — количество запросов, находящихся в обработке для каждого хоста ZooKeeper.
  • Connections per ZooKeeper host — количество подключений для каждого хоста ZooKeeper.
  • Transactions per ClickHouse® host — количество транзакций в секунду для каждого хоста ClickHouse®.
  • Average transaction time per ClickHouse® host — среднее время транзакции для каждого хоста ClickHouse®. Показывает время, затрачиваемое ClickHouse® на обращения к ZooKeeper.
  • Average latency per ZooKeeper host — средняя задержка ответа для каждого хоста ZooKeeper.
  • Znodes — количество объектов Znode.
  • Ephemeral nodes — количество объектов Ephemeral node.
  • Watches — количество объектов Watch.

Примечание

Подробнее об объектах Znode, Ephemeral node и Watch см. в документации ZooKeeper.

  • CPU cores usage — количество используемых процессорных ядер в подкластере ZooKeeper.
  • Для мониторинга использования оперативной памяти доступны графики:
    • Memory usage для подкластера ZooKeeper;
    • Memory usage для каждого хоста в подкластере ZooKeeper.
  • Для мониторинга занятого дискового пространства доступны графики:
    • Disk space usage для подкластера ZooKeeper;
    • Disk space usage для каждого хоста в подкластере ZooKeeper.
  • CPU cores usage per host — количество используемых процессорных ядер для каждого хоста.
  • CPU usage per host — загрузка процессорных ядер для каждого хоста.
  • Memory usage per host — процент использования оперативной памяти для каждого хоста.
  • Disk space usage per host — процент использования дискового пространства для каждого хоста.
  • Disk read per host — скорость чтения с диска для каждого хоста.
  • Disk write per host — скорость записи на диск для каждого хоста.
  • Disk usage per host — скорость дисковых операций для каждого хоста.
  • Network data received per host — скорость приема данных из сети для каждого хоста.
  • Network data sent per host — скорость отправки данных в сеть для каждого хоста.
  • Network usage per host — скорость обмена данными по сети для каждого хоста.

Мониторинг состояния хостовМониторинг состояния хостов

Для просмотра детальной информации о состоянии отдельных хостов Managed Service for ClickHouse®:

Консоль управления
  1. В консоли управления выберите каталог, в котором находится кластер.

  2. Перейдите в сервис Managed Service for ClickHouse.

  3. Нажмите на имя нужного кластера и выберите вкладку Мониторинг.

  4. Перейдите на вкладку Хосты и выберите хост.

    Для каждого хоста указан его тип CLICKHOUSE или ZOOKEEPER.

    Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в Monitoring на панели сверху.

ClickHouse®
ZooKeeper

Для хостов ClickHouse® отображаются графики:

  • Availability — доступность хоста.
  • Queries — количество запросов в секунду для каждого типа.
  • Connections — количество HTTP и TCP подключений.
  • Failed queries — процент неуспешных запросов для каждого типа.
  • Average query time — среднее время выполнения запросов для каждого типа.
  • Locks — количество активных и ожидающих блокировок на чтение и запись.
  • Processed data — скорость чтения, вставки и слияния данных.
  • Processed rows — скорость чтения, вставки и слияния строк в секунду.
  • Background tasks — количество задач слияния и мутаций, извлечения и перемещения в фоновом пуле.
  • Max replication delay across tables — максимальная задержка репликации таблиц. Значения больше нескольких секунд могут указывать на чрезмерную нагрузку или проблемы в работе репликации.
  • Replication queue — размер очереди репликации.
  • Max data parts per partition — максимальное количество кусков данных в партиции. Лимит для этой величины определяется настройками СУБД. Приближение к лимиту указывает на чрезмерную нагрузку или низкую эффективность вставки данных.
  • CPU usage, % — процент использования процессорных ядер.
  • Memory usage, % — процент использования оперативной памяти.
  • Disk space usage, % — процент использования дискового пространства.
  • CPU usage, cores — количество используемых процессорных ядер.
  • Memory usage, bytes — использование оперативной памяти.
  • Disk space usage, bytes — занятое дисковое пространство.
  • Disk throughput — пропускная способность диска.
  • Disk IOPS — количество операций чтения и записи для диска.
  • Network throughput — пропускная способность сети.

Для хостов ZooKeeper отображаются графики:

  • Availability — доступность хоста.
  • Role — роль хоста Leader или Follower в подкластере ZooKeeper.
  • Objects — количество объектов Znode, Ephemeral node и Watch.
  • Connections — количество активных подключений к хосту.
  • Outstanding requests — количество невыполненных запросов к ZooKeeper.
  • Request time — время обработки операций на чтение и запись.
  • CPU usage, % — процент использования процессорных ядер.
  • Memory usage, % — процент использования оперативной памяти.
  • Disk space usage, % — процент использования дискового пространства.
  • CPU usage, cores — количество используемых процессорных ядер.
  • Memory usage, bytes — использование оперативной памяти.
  • Disk space usage, bytes — занятое дисковое пространство.
  • Disk throughput — пропускная способность диска.
  • Disk IOPS — количество операций чтения и записи для диска.
  • Network throughput — пропускная способность сети.

Настройка алертов в Yandex MonitoringНастройка алертов в Yandex Monitoring

Консоль управления
  1. В консоли управления выберите каталог с кластером, для которого нужно настроить алерты.
  2. Перейдите в сервис  Monitoring.
  3. В блоке Сервисные дашборды выберите:
    • Managed Service for ClickHouse® — Cluster Overview для настройки алертов кластера;
    • Managed Service for ClickHouse® — ZooKeeper для настройки алертов хостов ZooKeeper.
    • Managed Service for ClickHouse® — Host Overview для настройки алертов хостов.
  4. На нужном графике с показателями нажмите на значок и выберите Создать алерт.
  5. Если на графике несколько показателей, выберите запрос данных для формирования метрики и нажмите Продолжить. Подробнее о языке запросов см. в документации Yandex Monitoring.
  6. Задайте значения порогов Alarm и Warning для срабатывания алерта.
  7. Нажмите кнопку Создать алерт.

Чтобы настроить автоматический мониторинг других показателей состояния кластера:

Консоль управления
  1. Создайте алерт.
  2. Добавьте метрику состояния.
  3. В параметрах алерта задайте значения порогов для оповещения.

Рекомендуемые значения порогов для некоторых метрик:

Метрика Обозначение Alarm Warning
Максимальное число кусков данных в разделе ch_system_async_metrics_MaxPartCountForPartition 250 150
Количество запросов, завершившихся с ошибкой ch_system_events_FailedQuery_rate 20% от общего числа запросов 10% от общего числа запросов
Размер использованного хранилища disk.used_bytes 95% от размера хранилища 80% от размера хранилища
Количество работоспособных хостов is_alive <количество_хостов> - 2 <количество_хостов> - 1

Чтобы определить пороговые значения метрики ch_system_events_FailedQuery_rate, используйте значение показателя Total queries для кластера.

Для метрики disk.used_bytes значения порогов Alarm и Warning задаются только в байтах. Например, рекомендуемые значения для диска размером в 100 ГБ:

  • Alarm — 102005473280 байт (95%).
  • Warning — 85899345920 байт (80%).

Текущий размер хранилища можно посмотреть в детальной информации о кластере. Полный список поддерживаемых метрик см. в документации Monitoring.

Состояние и статус кластераСостояние и статус кластера

Состояние кластера указывает на исправность его хостов, а Статус показывает, запущен кластер, остановлен или находится в промежуточном состоянии.

Для просмотра состояния и статуса кластера:

Консоль управления
  1. В консоли управления выберите каталог, в котором находится кластер.
  2. Перейдите в сервис Managed Service for ClickHouse.
  3. Наведите курсор на индикатор в столбце Доступность в строке нужного кластера.

Состояния кластераСостояния кластера

Состояние Описание Предлагаемые действия
ALIVE Кластер работает в штатном режиме. Действий не требуется.
DEGRADED Кластер работает не на полную мощность: минимум один из хостов имеет состояние, отличное от ALIVE. Выполните диагностику:
  • Перейдите на вкладку Хосты и посмотрите, какие из них в нерабочем состоянии.
  • Перейдите на вкладку Операции и убедитесь, что все операции завершились.
  • Убедитесь, что кластер не находится в процессе технического обслуживания.
Если причины не удалось выяснить самостоятельно, обратитесь в службу поддержки.
DEAD Кластер неработоспособен: ни один его хост не работает. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние DEAD.
UNKNOWN Состояние кластера неизвестно. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние UNKNOWN.

Статусы кластераСтатусы кластера

Статус Описание Предлагаемые действия
CREATING Идет подготовка к первому запуску Подождите немного и приступайте к работе. Время создания кластера зависит от класса хостов.
RUNNING Кластер работает в штатном режиме Действий не требуется.
STOPPING Кластер останавливается Через некоторое время кластеру будет присвоен статус STOPPED, и он будет выведен из работы. Действий не требуется.
STOPPED Кластер остановлен Запустите кластер, чтобы вернуть его в работу.
STARTING Остановленный ранее кластер запускается Через некоторое время кластеру будет присвоен статус RUNNING. Подождите немного и приступайте к работе.
UPDATING Обновляется конфигурация кластера По завершении обновления кластеру будет присвоен статус, который был до обновления: RUNNING или STOPPED.
ERROR Произошла ошибка при выполнении операции с кластером или во время окна технического обслуживания Если кластер долго находится в этом статусе, обратитесь в службу поддержки. Доступность кластера можно определить по его состоянию.
STATUS_UNKNOWN Кластер не может определить свой статус Если кластер долго находится в этом статусе, обратитесь в службу поддержки.

ClickHouse® является зарегистрированным товарным знаком ClickHouse, Inc.

Была ли статья полезна?

Предыдущая
Просмотр логов кластера
Следующая
Подключение из DataLens
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»