Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Кейсы
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Кейсы
  • Документация
  • Блог
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ТОО «Облачные Сервисы Казахстан»
Yandex Cloud Stackland
  • Что нового
  • Установка
    • Все руководства
    • Установить Stackland на Yandex BareMetal
    • Настройка внешнего доступа к поду в кластере
    • Все инструкции
    • Проекты
    • Ресурсная модель
      • Мониторинг ClickHouse
      • Метрики дашборда NVIDIA® DCGM
      • Метрики дашборда NVIDIA® DCGM с MIG
      • Метрики дашборда NVIDIA® DCGM без MIG
      • Мониторинг оборудования
  • Управление доступом
  • Правила тарификации
  • Диагностика и устранение неполадок

В этой статье:

  • Общая информация
  • Переменные дашборда
  • Панели и метрики
  • 1. Uptime (logarithmic)
  • 2. Failed Pods
  • 3. Version
  • 4. Tables / Databases
  • 5. ReadOnly replicas
  • 6. DNS and Distributed Connection Errors
  • 7. Replication and ZooKeeper Exceptions
  • 8. Delayed/Rejected/Pending Inserts
  • 9. Queries (running)
  • 10. Select Queries (started per sec)
  • 11. Memory for Queries
  • 12. Insert Queries (running)
  • 13. Insert Queries (started per sec)
  • 14. Rows Inserted
  • 15. Replication Queue Jobs
  • 16. Max Replica Delay
  • 17. Zookeeper Transactions
  • 18. Merges
  • 19. Merged Rows
  • 20. Merged Uncompressed Bytes
  • 21. Active Parts
  • 22. Detached parts
  • 23. Max Part count for Partition
  • 24. clickhouse-server Process Memory
  • 25. Primary Keys Memory
  • 26. Dictionary Memory
  • 27. Disk Space Free
  • 28. Table Stats
  • 29. Clickhouse Data size on Disk
  • 30. Background Tasks
  • 31. Mutations
  • 32. Marks Cache Hit Rate
  • 33. CPU Time per second
  • 34. Network / Disk CPU Time per second
  • 35. Load Average 1m
  • 36. CPU Time total
  • 37. Connections
  • Рекомендации по мониторингу
  • Критические метрики
  • Метрики производительности
  • Метрики репликации
  • Метрики хранения
  • Дополнительные ресурсы
  1. Концепции
  2. Мониторинг кластера
  3. Мониторинг ClickHouse

Метрики дашборда ClickHouse®

Статья создана
Yandex Cloud
Обновлена 23 марта 2026 г.
  • Общая информация
  • Переменные дашборда
  • Панели и метрики
    • 1. Uptime (logarithmic)
    • 2. Failed Pods
    • 3. Version
    • 4. Tables / Databases
    • 5. ReadOnly replicas
    • 6. DNS and Distributed Connection Errors
    • 7. Replication and ZooKeeper Exceptions
    • 8. Delayed/Rejected/Pending Inserts
    • 9. Queries (running)
    • 10. Select Queries (started per sec)
    • 11. Memory for Queries
    • 12. Insert Queries (running)
    • 13. Insert Queries (started per sec)
    • 14. Rows Inserted
    • 15. Replication Queue Jobs
    • 16. Max Replica Delay
    • 17. Zookeeper Transactions
    • 18. Merges
    • 19. Merged Rows
    • 20. Merged Uncompressed Bytes
    • 21. Active Parts
    • 22. Detached parts
    • 23. Max Part count for Partition
    • 24. clickhouse-server Process Memory
    • 25. Primary Keys Memory
    • 26. Dictionary Memory
    • 27. Disk Space Free
    • 28. Table Stats
    • 29. Clickhouse Data size on Disk
    • 30. Background Tasks
    • 31. Mutations
    • 32. Marks Cache Hit Rate
    • 33. CPU Time per second
    • 34. Network / Disk CPU Time per second
    • 35. Load Average 1m
    • 36. CPU Time total
    • 37. Connections
  • Рекомендации по мониторингу
    • Критические метрики
    • Метрики производительности
    • Метрики репликации
    • Метрики хранения
  • Дополнительные ресурсы

Дашборд ClickHouse® в Grafana предоставляет комплексный мониторинг кластера СУБД ClickHouse®. Дашборд содержит метрики производительности, состояния репликации, использования ресурсов и других важных параметров работы кластера.

Чтобы открыть дашборд кластера:

  1. Если вы еще не открыли проект, выберите проект.
  2. В левом меню выберите ClickHouse® Clusters.
  3. Выберите кластер.
  4. Нажмите кнопку Мониторинг кластера.

Откроется дашборд кластера.

Общая информацияОбщая информация

Название дашборда: ClickHouse®
UID: clickhouse-operator
Интервал обновления: 10 секунд
Источник данных: Prometheus

Переменные дашбордаПеременные дашборда

Дашборд использует следующие переменные для фильтрации данных:

  • Cluster (chi) — выбор кластера ClickHouse®;
  • Server (hostname) — выбор конкретного сервера;
  • Namespace (namespace) — проект Stackland, где развернут ClickHouse® Operator.

Панели и метрикиПанели и метрики

1. Uptime (logarithmic)1. Uptime (logarithmic)

Описание: Время работы серверов ClickHouse® с момента последнего запуска. График использует логарифмическую шкалу для удобного отображения больших значений.

Метрика: chi_clickhouse_metric_Uptime

Единица измерения: секунды

2. Failed Pods2. Failed Pods

Описание: Количество подов, с которых metrics-exporter не может получить метрики от clickhouse-server. Ненулевое значение указывает на проблемы с доступностью серверов.

Метрика: chi_clickhouse_metric_fetch_errors

Единица измерения: количество

Рекомендации: При обнаружении ошибок проверьте статус подов командой kubectl get pods --all-namespaces | grep clickhouse.

Ссылки:

  • metric_fetch_errors на GitHub

3. Version3. Version

Описание: Версия ClickHouse®, установленная на серверах. Версия отображается в числовом формате (например, версия 11.22.33 отображается как 11022033).

Метрика: chi_clickhouse_metric_VersionInteger

Единица измерения: числовое представление версии

4. Tables / Databases4. Tables / Databases

Описание: Общее количество таблиц и баз данных в кластере.

Метрики:

  • chi_clickhouse_metric_NumberOfTables — количество таблиц;
  • chi_clickhouse_metric_NumberOfDatabases — количество баз данных.

Единица измерения: количество

5. ReadOnly replicas5. ReadOnly replicas

Описание: Количество реплик, находящихся в режиме только для чтения. Ненулевое значение указывает на проблемы с репликацией.

Метрика: chi_clickhouse_metric_ReadonlyReplica

Единица измерения: количество

Рекомендации: Проверьте подключение к ZooKeeper, свободное место на диске и сетевое соединение между репликами.

Ссылки:

  • Восстановление после сбоев
  • Восстановление после потери данных

6. DNS and Distributed Connection Errors6. DNS and Distributed Connection Errors

Описание: Ошибки DNS и сбои соединений между серверами в распределенных таблицах.

Метрики:

  • chi_clickhouse_event_NetworkErrors — сетевые ошибки;
  • chi_clickhouse_event_DistributedConnectionFailAtAll — полные сбои распределенных соединений;
  • chi_clickhouse_event_DistributedConnectionFailTry — попытки соединения, завершившиеся неудачей;
  • chi_clickhouse_event_DNSError — ошибки DNS.

Единица измерения: количество событий в минуту

Ссылки:

  • Управление распределенными таблицами
  • DNSError на GitHub

7. Replication and ZooKeeper Exceptions7. Replication and ZooKeeper Exceptions

Описание: Метрики репликации и исключения при работе с ZooKeeper.

Метрики:

  • chi_clickhouse_metric_ReadonlyReplica — реплики только для чтения;
  • chi_clickhouse_event_ReplicaPartialShutdown — частичное отключение реплик;
  • chi_clickhouse_event_ZooKeeperUserExceptions — пользовательские исключения ZooKeeper;
  • chi_clickhouse_event_ZooKeeperInit — инициализация ZooKeeper;
  • chi_clickhouse_metric_ZooKeeperSession — сессии ZooKeeper;
  • chi_clickhouse_event_ZooKeeperHardwareExceptions — аппаратные исключения ZooKeeper.

Единица измерения: количество событий в минуту

Ссылки:

  • Рекомендуемые настройки ZooKeeper
  • system.zookeeper

8. Delayed/Rejected/Pending Inserts8. Delayed/Rejected/Pending Inserts

Описание: Метрики задержанных, отклоненных и ожидающих вставок данных.

Метрики:

  • chi_clickhouse_metric_DelayedInserts — текущее количество задержанных запросов INSERT;
  • chi_clickhouse_event_DelayedInserts — общий счетчик задержанных блоков;
  • chi_clickhouse_event_RejectedInserts — количество отклоненных блоков;
  • chi_clickhouse_metric_DistributedFilesToInsert — файлы, ожидающие вставки в распределенные таблицы;
  • chi_clickhouse_metric_BrokenDistributedFilesToInsert — поврежденные файлы распределенных таблиц.

Единица измерения: количество

Описание метрик:

  • delayed query — количество запросов INSERT, которые замедлены из-за большого количества активных частей данных;
  • delayed blocks — количество блоков, вставка которых была замедлена;
  • rejected blocks — количество блоков, вставка которых была отклонена с ошибкой «Too many parts».

Рекомендации: Проверьте параметры parts_to_delay_insert и parts_to_throw_insert в таблице system.merge_tree_settings.

Ссылки:

  • system.parts_log
  • system.merge_tree_settings

9. Queries (running)9. Queries (running)

Описание: Количество выполняющихся запросов на каждом сервере и в целом по кластеру.

Метрика: chi_clickhouse_metric_Query

Единица измерения: количество

Ссылки:

  • max_concurrent_queries
  • max_execution_time

10. Select Queries (started per sec)10. Select Queries (started per sec)

Описание: Количество запросов SELECT, запущенных в секунду.

Метрика: chi_clickhouse_event_SelectQuery

Единица измерения: запросов в секунду

11. Memory for Queries11. Memory for Queries

Описание: Общий объем памяти, выделенной для выполняющихся запросов. Некоторые выделения памяти могут не учитываться.

Метрика: chi_clickhouse_metric_MemoryTracking

Единица измерения: байты

Ссылки:

  • max_memory_usage

12. Insert Queries (running)12. Insert Queries (running)

Описание: Количество выполняющихся запросов INSERT. Не включает запросы, которые не прошли парсинг или были отклонены из-за ограничений. Включает внутренние запросы, инициированные ClickHouse®

Метрика: chi_clickhouse_event_InsertQuery

Единица измерения: запросов в минуту

13. Insert Queries (started per sec)13. Insert Queries (started per sec)

Описание: Количество запросов INSERT, запущенных в секунду.

Метрика: chi_clickhouse_event_InsertQuery

Единица измерения: запросов в секунду

14. Rows Inserted14. Rows Inserted

Описание: Количество строк, вставленных в таблицы.

Метрика: chi_clickhouse_event_InsertedRows

Единица измерения: строк в минуту

15. Replication Queue Jobs15. Replication Queue Jobs

Описание: Интенсивность обмена частями (parts) данных между репликами.

Метрики:

  • chi_clickhouse_event_ReplicatedDataLoss — потеря данных при репликации;
  • chi_clickhouse_event_ReplicatedPartChecks — счетчик проверок частей данных;
  • chi_clickhouse_event_ReplicatedPartChecksFailed — счетчик неудачных проверок частей данных;
  • chi_clickhouse_event_ReplicatedPartFetches — показатель сетевой репликационной активности;
  • chi_clickhouse_event_ReplicatedPartFailedFetches — счетчик неудачных попыток получения частей данных;
  • chi_clickhouse_event_ReplicatedPartFetchesOfMerged — получение объединенных частей данных;
  • chi_clickhouse_event_ReplicatedPartMerges — объединение реплицированных частей данных;
  • chi_clickhouse_metric_ReplicasSumInsertsInQueue — задержка репликации данных, показывает количество необработанных запросов в очереди;
  • chi_clickhouse_metric_ReplicasSumMergesInQueue — задержка слияния данных, показывает количество еще невыполненных репликами слияний данных.

Единица измерения: количество событий в минуту

Ссылки:

  • Как работает репликация

16. Max Replica Delay16. Max Replica Delay

Описание: Задержка реплик относительно текущего времени при прямой вставке в таблицы *ReplicatedMergeTree.

Метрики:

  • chi_clickhouse_metric_ReplicasMaxAbsoluteDelay — абсолютная задержка в секундах;
  • chi_clickhouse_metric_ReplicasMaxRelativeDelay — относительная задержка в секундах.

Единица измерения: секунды

Ссылки:

  • Архитектура репликации
  • ReplicatedMergeTree
  • max_replica_delay_for_distributed_queries

17. Zookeeper Transactions17. Zookeeper Transactions

Описание: Количество транзакций ZooKeeper в секунду.

Метрика: chi_clickhouse_event_ZooKeeperTransactions

Единица измерения: транзакций в секунду

Ссылки:

  • Архитектура репликации

18. Merges18. Merges

Описание: Интенсивность фоновых процессов слияния частей данных.

Метрика: chi_clickhouse_event_Merge

Единица измерения: слияний в минуту

Ссылки:

  • START/STOP Merges
  • MergeTree Engine

19. Merged Rows19. Merged Rows

Описание: Количество строк, обработанных в процессе слияния.

Метрика: chi_clickhouse_event_MergedRows

Единица измерения: строк в минуту

20. Merged Uncompressed Bytes20. Merged Uncompressed Bytes

Описание: Объем несжатых данных, обработанных в процессе слияния.

Метрика: chi_clickhouse_event_MergedUncompressedBytes

Единица измерения: байты в минуту

21. Active Parts21. Active Parts

Описание: Количество активных частей данных в таблицах.

Метрика: chi_clickhouse_table_parts (с фильтром active="1")

Единица измерения: количество

Ссылки:

  • system.parts
  • parts_to_delay_insert

22. Detached parts22. Detached parts

Описание: Количество отсоединенных частей данных с указанием причины отсоединения.

Метрики:

  • chi_clickhouse_metric_DetachedParts — количество отсоединённых частей данных;
  • chi_clickhouse_table_parts (с фильтром active="0") — неактивные части.

Единица измерения: количество

Причины отсоединения:

  • detached_by_user — отсоединено пользователем;
  • broken — поврежденные части;
  • clone — клонированные части;
  • ignored — игнорируемые части.

Ссылки:

  • system.detached_parts

23. Max Part count for Partition23. Max Part count for Partition

Описание: Максимальное количество физических частей данных в одной логической партиции.

Метрика: chi_clickhouse_metric_MaxPartCountForPartition

Единица измерения: количество

Ссылки:

  • Custom Partitioning Key
  • system.parts
  • system.part_log

24. clickhouse-server Process Memory24. clickhouse-server Process Memory

Описание: Использование памяти процессом clickhouse-server (доступно с версии ClickHouse® 20.4+).

Метрики:

  • chi_clickhouse_metric_MemoryCode — CODE (исполняемый код);
  • chi_clickhouse_metric_MemoryResident — RSS (резидентная память);
  • chi_clickhouse_metric_MemoryShared — SHR (разделяемая память);
  • chi_clickhouse_metric_MemoryDataAndStack — DATA (данные и стек);
  • chi_clickhouse_metric_MemoryVirtual — VIRT (виртуальная память).

Единица измерения: байты

Описание типов памяти:

  • VIRT — общий объем виртуальной памяти (VIRT = SWAP + RSS);
  • SWAP — объем выгруженной в swap памяти;
  • RSS — физическая память, не выгруженная в swap (RSS = CODE + DATA);
  • CODE — память для исполняемого кода (Text Resident Set);
  • DATA — память для данных, отличных от исполняемого кода (Data Resident Set);
  • SHR — разделяемая память, которая может использоваться другими процессами.

Ссылки:

  • Описание типов памяти Linux

25. Primary Keys Memory25. Primary Keys Memory

Описание: Объем памяти, выделенной для хранения первичных ключей.

Метрика: chi_clickhouse_metric_MemoryPrimaryKeyBytesAllocated

Единица измерения: байты

Ссылки:

  • Выбор первичного ключа

26. Dictionary Memory26. Dictionary Memory

Описание: Объем памяти, выделенной для словарей.

Метрика: chi_clickhouse_metric_MemoryDictionaryBytesAllocated

Единица измерения: байты

Ссылки:

  • system.dictionaries
  • CREATE DICTIONARY

27. Disk Space Free27. Disk Space Free

Описание: Процент свободного места на дисках. Важно учитывать конфигурацию с несколькими томами, Kubernetes volume claims и Object Storage в качестве бэкенда хранения.

Метрика: chi_clickhouse_metric_DiskFreeBytes / chi_clickhouse_metric_DiskTotalBytes

Единица измерения: процент (0-1)

Ссылки:

  • system.disks
  • Multiple Disk Volumes

28. Table Stats28. Table Stats

Описание: Статистика по таблицам: размер данных, количество строк, количество частей и средний размер строки.

Метрики:

  • chi_clickhouse_table_parts_bytes — размер данных в байтах;
  • chi_clickhouse_table_parts_rows — количество строк;
  • chi_clickhouse_table_parts — количество частей.

Единица измерения:

  • Bytes — байты;
  • Rows — количество строк;
  • Parts — количество частей;
  • BytePerRow — байт на строку (вычисляемое поле).

29. Clickhouse Data size on Disk29. Clickhouse Data size on Disk

Описание: Общий размер данных всех таблиц *MergeTree на диске.

Метрика: chi_clickhouse_metric_DiskDataBytes

Единица измерения: байты

Ссылки:

  • system.parts

30. Background Tasks30. Background Tasks

Описание: Количество активных фоновых задач.

Метрики:

  • chi_clickhouse_metric_BackgroundPoolTask — задачи слияния, мутаций, получения данных или управления очередью репликации;
  • chi_clickhouse_metric_BackgroundSchedulePoolTask — периодические задачи ReplicatedMergeTree (очистка старых частей, изменение частей, реинициализация реплик);
  • chi_clickhouse_metric_BackgroundMovePoolTask — задачи перемещения данных.

Единица измерения: количество

Ссылки:

  • FETCH PARTITION
  • Mutations
  • Data TTL
  • MOVE PARTITION

31. Mutations31. Mutations

Описание: Количество активных мутаций (ALTER DELETE/ALTER UPDATE) и частей данных, ожидающих мутации.

Метрики:

  • chi_clickhouse_table_mutations — количество мутаций;
  • chi_clickhouse_table_mutations_parts_to_do — количество частей, ожидающих мутации.

Единица измерения: количество

Ссылки:

  • Mutations
  • system.mutations
  • KILL MUTATION

32. Marks Cache Hit Rate32. Marks Cache Hit Rate

Описание: Процент попаданий в кэш файлов меток (.mrk), которые читаются из памяти вместо диска.

Метрика: chi_clickhouse_event_MarkCacheHits / (chi_clickhouse_event_MarkCacheHits + chi_clickhouse_event_MarkCacheMisses)

Единица измерения: процент (0-1)

Ссылки:

  • mark_cache_size
  • MergeTree architecture

33. CPU Time per second33. CPU Time per second

Описание: Время, которое CPU тратит на различные типы активности.

Метрики:

  • chi_clickhouse_event_RealTimeMicroseconds — реальное время выполнения;
  • chi_clickhouse_event_UserTimeMicroseconds — время в пользовательском режиме;
  • chi_clickhouse_event_SystemTimeMicroseconds — время в системном режиме;
  • chi_clickhouse_event_OSIOWaitMicroseconds — ожидание операций ввода-вывода;
  • chi_clickhouse_event_OSCPUWaitMicroseconds — ожидание CPU;
  • chi_clickhouse_event_OSCPUVirtualTimeMicroseconds — виртуальное время CPU.

Единица измерения: микросекунды в секунду

34. Network / Disk CPU Time per second34. Network / Disk CPU Time per second

Описание: Время CPU, затраченное на операции с сетью и диском.

Метрики:

  • chi_clickhouse_event_DiskReadElapsedMicroseconds — время чтения с диска;
  • chi_clickhouse_event_DiskWriteElapsedMicroseconds — время записи на диск;
  • chi_clickhouse_event_NetworkReceiveElapsedMicroseconds — время приема данных по сети;
  • chi_clickhouse_event_NetworkSendElapsedMicroseconds — время отправки данных по сети.

Единица измерения: микросекунды в секунду

35. Load Average 1m35. Load Average 1m

Описание: Средняя загрузка системы за одну минуту, стандартный Unix Load Average. Нагрузка считается предельной, если показатель близок количеству доступных CPU или к выделенным для пода ClickHouse® лимитам.

Метрика: chi_clickhouse_metric_LoadAverage1

Единица измерения: безразмерная величина

36. CPU Time total36. CPU Time total

Описание: Общее время CPU, затраченное на различные типы активности за выбранный период.

Метрики:

  • chi_clickhouse_event_DiskReadElapsedMicroseconds — чтение с диска;
  • chi_clickhouse_event_DiskWriteElapsedMicroseconds — запись на диск;
  • chi_clickhouse_event_NetworkReceiveElapsedMicroseconds — прием по сети;
  • chi_clickhouse_event_NetworkSendElapsedMicroseconds — отправка по сети;
  • chi_clickhouse_event_RealTimeMicroseconds — время выполнения запросов в реальном времени;
  • chi_clickhouse_event_UserTimeMicroseconds — пользовательское время;
  • chi_clickhouse_event_SystemTimeMicroseconds — системное время;
  • chi_clickhouse_event_OSIOWaitMicroseconds — ожидание I/O;
  • chi_clickhouse_event_OSCPUWaitMicroseconds — ожидание CPU;
  • chi_clickhouse_event_OSCPUVirtualTimeMicroseconds — время на виртуальные процессы операционной системы;
  • chi_clickhouse_event_ThrottlerSleepMicroseconds — время ожидания троттлера;
  • chi_clickhouse_event_DelayedInsertsMilliseconds — задержанные вставки;
  • chi_clickhouse_event_ZooKeeperWaitMicroseconds — ожидание ZooKeeper;
  • chi_clickhouse_event_CompileExpressionsMicroseconds — компиляция выражений;
  • chi_clickhouse_event_MergesTimeMilliseconds — время слияний;
  • chi_clickhouse_event_RWLockReadersWaitMilliseconds — ожидание блокировки чтения;
  • chi_clickhouse_event_RWLockWritersWaitMilliseconds — ожидание блокировки записи;
  • chi_clickhouse_event_SelectQueryTimeMicroseconds — время SELECT-запросов;
  • chi_clickhouse_event_InsertQueryTimeMicroseconds — время INSERT-запросов;
  • chi_clickhouse_event_Object StorageReadMicroseconds — время чтения из Object Storage;
  • chi_clickhouse_event_Object StorageWriteMicroseconds — время записи в Object Storage.

Единица измерения: микросекунды

Интервал: 1 минута

37. Connections37. Connections

Описание: Различные типы соединений для каждого сервера.

Метрики:

  • chi_clickhouse_metric_TCPConnection — TCP-соединения (нативный протокол);
  • chi_clickhouse_metric_HTTPConnection — HTTP-соединения;
  • chi_clickhouse_metric_InterserverConnection — межсерверные соединения;
  • chi_clickhouse_metric_MySQLConnection — MySQL-соединения.

Единица измерения: количество

Ссылки:

  • max_connections
  • max_distributed_connections
  • MySQL Protocol
  • HTTP Protocol
  • Native Protocol

Рекомендации по мониторингуРекомендации по мониторингу

Критические метрикиКритические метрики

Следующие метрики требуют немедленного внимания при отклонении от нормы:

  1. Failed Pods — должно быть 0. Ненулевое значение указывает на недоступность серверов;
  2. ReadOnly replicas — должно быть 0. Указывает на проблемы с репликацией;
  3. DNS and Distributed Connection Errors — должны быть минимальными. Высокие значения указывают на сетевые проблемы;
  4. Delayed/Rejected Inserts — высокие значения указывают на проблемы с производительностью записи;
  5. Disk Space Free — следите за свободным местом, критический порог — менее 10%.

Метрики производительностиМетрики производительности

Для оценки производительности кластера обращайте внимание на:

  1. Queries (running) — количество одновременно выполняющихся запросов;
  2. Memory for Queries — потребление памяти запросами;
  3. CPU Time per second — загрузка процессора;
  4. Marks Cache Hit Rate — эффективность кэширования (должна быть > 90%).

Метрики репликацииМетрики репликации

Для контроля состояния репликации:

  1. Replication Queue Jobs — размер очереди репликации;
  2. Max Replica Delay — задержка реплик;
  3. Zookeeper Transactions — интенсивность работы с ZooKeeper.

Метрики храненияМетрики хранения

Для контроля использования дискового пространства:

  1. Active Parts — количество активных частей данных;
  2. Detached parts — отсоединенные части (должны быть минимальными);
  3. Max Part count for Partition — количество частей в партиции;
  4. Clickhouse Data size on Disk — общий размер данных.

Дополнительные ресурсыДополнительные ресурсы

  • Официальная документация ClickHouse®;
  • ClickHouse® Operator на GitHub;
  • System Tables Reference;
  • Server Configuration Parameters.

Была ли статья полезна?

Предыдущая
SpeechSense
Следующая
Метрики дашборда NVIDIA® DCGM
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ТОО «Облачные Сервисы Казахстан»