Обзор метрик в Monitoring
В разделе Обзор метрик можно отслеживать различные показатели вашей инфраструктуры и приложений в реальном времени. Например, использование памяти виртуальной машиной в сервисе Compute Cloud или количество запросов к виртуальному хосту в сервисе Application Load Balancer.
Monitoring позволяет:
- Гибко настраивать метрики и производные метрики с использованием собственных формул.
- Отображать на графике одну или несколько разных метрик.
- Просматривать детализированные данные по каждой метрике.
- Дублировать графики с метрикой, разделив ее по какому-либо параметру.
- Отслеживать изменения во времени и сравнивать метрики для схожих элементов вашей инфраструктуры.
С помощью обзора метрик вы можете выполнять следующие задачи:
-
Мониторинг производительности — оценить нагрузку на систему, количество разрешенных и заблокированных запросов к хосту, количество ошибок в работе.
-
Анализ трендов — изучить, как менялись метрики со временем, определите время пиковой нагрузки и простоя.
-
Поиск и устранение проблем — искать проблемы в работе ваших сервисов, определяя подозрительные показатели.
-
Расследование инцидентов — посмотреть, как менялись метрики до инцидента, какие метрики и элементы системы связаны с аномалией.
-
Настройка графиков для дашборда и добавление алертов — добавлять графики на дашборд, чтобы сохранить их и регулярно отслеживать. Создавать алерты, чтобы получать уведомления о резких изменениях метрик.
Настройку и работу с графиками см. в разделе Посмотреть метрики ваших сервисов в Yandex Monitoring.
Повторение графиков по параметрам
Функция повторения графиков по определенному параметру позволяет строить несколько аналогичных графиков, но с разными значениями этого параметра. Это помогает при исследовании аномальных показателей и проблем, поскольку можно разделить одну метрику на несколько и исследовать каждую в отдельности.
Например, в вашем облаке развернуто несколько виртуальных машин и наблюдается резкий рост загрузки процессора. Чтобы быстро локализовать проблему:
- Постройте график загрузки процессора для всех виртуальных машин.
- Включите повторение графиков по виртуальным машинам — будут построены отдельные графики для каждой ВМ.
- Для ВМ, у которой обнаружены высокие показатели, постройте графики загрузки по каждому процессору.
Такой способ исследования данных называется Drill Down — переход от более общих данных к более детальным для максимально точной локализации проблемы или аномалии.
Настройку повторения графиков см. в разделе Разбить график по определенному параметру.