Вопросы и ответы про Monitoring
Общие вопросы
Я могу получить логи моей работы в сервисах?
Да, вы можете запросить записи о том, что происходило с вашими ресурсами, из логов сервисов Yandex Cloud. Подробнее читайте в разделе Запросы данных.
Как посмотреть сервисные дашборды?
Сервисные дашборды создаются автоматически после создания ресурсов в Yandex Cloud. Добавьте необходимый ресурс и обновите главную страницу
Почему пропали старые данные графиков в Monitoring?
Метрики, для которых новые значения не поступали в течение 30 дней, автоматически удаляются из Monitoring. Для сервиса Yandex Managed Service for Prometheus® этот срок составляет 60 дней, для сервиса Yandex Compute Cloud — 7 дней. Подробнее в разделе Удаление устаревших метрик (TTL).
Существует также ненастраиваемый механизм прореживания данных, сокращающий их объем в хранилищах.
Почему не передаются метрики и нельзя создать воркспейс Prometheus?
Такое возможно, если в облаке нет ресурсов, которые передают данные мониторинга. Начните использовать какой-либо ресурс и дождитесь, когда метрики начнут отображаться в Monitoring.
Навигация
Где посмотреть график RAM на виртуальной машине?
Сервис Yandex Compute Cloud не может измерить потребление vRAM внутри гостевой операционной системы: для сервиса потребление памяти ВМ всегда одинаковое — то, которое выделено в момент ее запуска.
Вы можете самостоятельно настроить сбор пользовательских метрик через API, а для Linux-совместимых ОС — с помощью агента для поставки системных метрик.
Где посмотреть график места на диске ВМ?
Monitoring не имеет доступа к гостевым ОС, поэтому такой метрики нет.
Вы можете самостоятельно настроить сбор пользовательских метрик через API, а для Linux-совместимых ОС — с помощью агента для поставки системных метрик.
Сбор и экспорт метрик
Как добавить метрику RAM на виртуальной машине?
Сервис Yandex Compute Cloud не может измерить потребление vRAM внутри гостевой операционной системы: для сервиса потребление памяти ВМ всегда одинаковое — то, которое выделено в момент ее запуска.
Вы можете самостоятельно настроить сбор пользовательских метрик через API, а для Linux-совместимых ОС — с помощью агента для поставки системных метрик. Агент позволяет собирать статистику использования большинства системных ресурсов: процессор, память, сеть, диск.
Как добавить метрику места на диске виртуальной машины?
Monitoring не имеет доступа к гостевым ОС, поэтому такой метрики нет.
Вы можете самостоятельно настроить сбор пользовательских метрик Запись пользовательских метрик через API, а для Linux-совместимых ОС — с помощью агента для поставки системных метрик. Агент позволяет собирать статистику использования большинства системных ресурсов: процессор, память, сеть, диск.
Как собирать свои метрики из приложения?
Yandex Unified Agent поддерживает сбор метрик в формате Prometheus и конвертацию метрик в формат Monitoring. Таким образом, при помощи Unified Agent можно собирать метрики любых приложений, предоставляющих метрики в формате Prometheus.
Воспользуйтесь клиентской библиотекой
Примеры приведены в следующих разделах документации:
Можно ли поставлять в Monitoring метрики кластера Yandex Managed Service for Kubernetes?
Да, для этого используйте приложение Metrics Provider. Чтобы установить его, воспользуйтесь инструкцией.
Как поставлять в Monitoring метрики сторонних приложений?
Для поставки в Monitoring метрик сторонних приложений используется Unified Agent, в котором сконфигурирован вход metrics_pull
. Unified Agent периодически опрашивает напрямую стороннее приложение, если оно поддерживает метрики в формате Prometheus, или специальное приложение-экспортер, реализующее интеграцию с Prometheus.
В разделе Поставка метрик HAProxy и других сторонних приложений приведен пример настройки поставки метрик HAProxy.
Как поставлять метрики с хостов вне Yandex Cloud?
Настройте авторизованные ключи сервисных аккаунтов для передачи метрик в Monitoring через Unified Agent.
Используйте эту методику и для отправки метрик с ВМ Yandex Cloud без привязанного сервисного аккаунта.
Как посмотреть список метрик?
Для этого откройте раздел Обзор метрик и выберите нужный сервис.
Чтобы получить полный список метрик, принадлежащих определенному облаку и каталогу, воспользуйтесь инструкцией по запросу к API.
Можно ли экспортировать метрики в формате Prometheus?
Для экспорта метрик в формате Prometheus воспользуйтесь методом prometheusMetrics.
Пример настройки экспорта описан в документации.
Метрики и единицы измерения
Что означает запятая?
Запятая отделяет целую часть числа от дробной. Например, значение 123,456
следует трактовать как 123 целых 456 тысячных.
Почему cpu_usage более 100%?
Вы используете виртуальную машину с гарантированной долей ниже 100% vCPU. Например, гарантировано 20% производительности vCPU. Для системы мониторинга эта доля принимается за 100% ожидаемой нагрузки. Если на физическом ядре не окажется «соседей», вашей ВМ может быть выдано до 100% мощности vCPU, что в 5 раз больше гарантированной доли. На графике может отобразиться до 500%.
Если вы видите превышение верхней границы 100% на графиках длительное время, рекомендуем увеличить гарантированную долю vCPU. В любой момент на физическом ядре могут появиться «соседи», и реальное потребление vCPU может упасть до гарантированных 20% (около 400 МГц для платформы Intel Cascade Lake).
Где посмотреть описание метрик баз данных?
Описания метрик приведены в документации к сервисам, например:
- Yandex Managed Service for PostgreSQL.
- Yandex Managed Service for MySQL®.
- Yandex Managed Service for Redis.
Важные метрики выведены на сервисные дашборды каждого сервиса. Полный список метрик для каждого сервиса доступен в разделе Обзор метрик. Выгрузить полный список метрик можно по инструкции.
Как настроить единицы измерения на графике?
Единицы измерения настраиваются во вкладке Оси при редактировании графика. Можно выбрать тип единицы измерения, задать формат чисел, масштаб (линейный или логарифмический), максимальное и минимальное значения.
Как отображаются максимумы/пики на графиках?
Monitoring получает метрики за определенный период времени группами и при создании точки усредняет значения. При уменьшении масштаба временного отрезка количество значений в выборке увеличивается, и пиковые значения на графике могут расти.
Это работает и в обратную сторону — при выборе большего интервала времени точечные пиковые значения сглаживаются и могут не быть видны на графике.
Почему график пропал или выглядит обрезанным?
Данные могли попасть за пределы установленных границ графика. Проверьте настройки масштаба, а также максимального и минимального значений на вкладке Оси.
Есть ли описание функций в языке запросов?
Описание функций приведено в Справочнике.
Вы можете протестировать функции в разделе Обзор метрик.
Алерты/уведомления
Как уменьшить число ложных срабатываний алерта?
Вы можете увеличить окно вычисления или поменять функцию агрегации в параметрах алерта.
Какое значение указывать в пороге?
Значение порога задают в единицах измерения выбранной метрики.
Например, для порога свободного места на диске кластера баз данных значение указывается в байтах. Значение порога удобно задавать, передвигая ползунок на графике с реальными данными. Значение порога для Warning не должно превышать значение порога для Alarm.
Как задать получателя алерта?
В канале уведомлений поддерживаются следующие методы:
Email
;SMS
;Push-уведомления
(в мобильном приложении Yandex Cloud);Telegram
.
В качестве получателя почтовых уведомлений нужно указать аккаунт в Yandex Cloud. Это может быть аккаунт владельца или специально добавленный для этих целей дополнительный аккаунт, например федеративный аккаунт или Яндекс ID.
Почему пользователю не приходят алерты?
Проверьте настройки почтового ящика и номера телефона в аккаунте пользователя в канале уведомлений.
Чтобы получать уведомления, пользователь должен:
- иметь роль
monitoring.viewer
на каталог, в котором настроен алерт. - в настройках
консоли управления:- включить опцию Мониторинг;
- указать адрес электронной почты, номер телефона и Telegram-аккаунт или группу.