Алерт
Алерт — периодически вычисляемый набор последовательных именованных запросов.
Набор запросов вычисляется раз в минуту. Полученное значение запроса, указанного в настройках, сравнивается с заранее заданными пороговыми значениями.
Если результат запроса, указанного в настройках, достигает порогового значения, Monitoring переводит алерт в статус Alarm
или Warning
и оповещает пользователя по каналу уведомления.
Статусы алертов
Алерт может находиться в одном из следующих статусов:
Статус | Описание |
---|---|
OK |
Значение метрики в пределах установленной нормы. |
Warning |
Значение метрики достигло порога предупреждения Warning . |
Alarm |
Значение метрики достигло порога критического статуса Alarm . |
No data |
Для вычисления функции алерта не хватает данных метрик. |
Error |
Значение алерта вычислить невозможно. |
История вычислений алерта
История вычислений алерта представлена в виде графика, состоящего из столбцов, цвет которых зависит от статуса алерта на момент его вычисления.
Для навигации по истории можно выбрать один из предустановленных масштабов отображения:
1h
— 1 час.1d
— 1 день.1w
— 1 неделя.1m
— 1 месяц.
Минимальный масштаб отображения истории — 1h
: каждый столбец на графике показывает статус алерта в соответствующую минуту. При больших масштабах цвет столбца составляется из статусов, вычисленных в этом интервале.
При нажатии на столбец загружается информация о настройках алерта в выбранный момент вычисления.
Примечание
При загрузке информации из истории вычисления производится повторный расчет статуса алерта, который отображается в поле Статус вычисления алерта. Статус алерта в истории может не совпадать с текущим результатом вычисления из-за особенностей прореживания исторических данных или задержек при поставке данных в Monitoring.
Настройки алерта
Настройки алерта задаются при его создании. После сохранения алерта их можно изменить.
Запросы
Набор запросов, которые возвращают линию или набор линий.
Можно:
- отключить вычисление запроса, нажав кнопку
и выбрав Деактивировать. Ссылки на запросы, которые не вычисляются, приводят к ошибкам. - скрыть результаты вычисления запроса на графике, нажав кнопку
. - отобразить результаты вычисления запроса на графике, нажав кнопку
.
Условия срабатывания
Запрос для проверки
Имя запроса, к результату вычисления которого применяется функция агрегации.
Функция агрегации
Функция агрегации применяется к результату вычисления запроса для проверки.
Функция агрегации | Описание |
---|---|
Хотя бы одно значение | Хотя бы одно из значений метрики в запросе превышает заданные пороги в указанном периоде. |
Все значения | Все значения метрики в запросе превышают заданные пороги в указанном периоде. |
Среднее | Вычисляет среднее значение в указанном периоде для каждой метрики. Например, если запрос возвращает две метрики, Monitoring для каждой из них вычисляет среднее значение в указанном окне. |
Количество | Вычисляет количество значений метрики в указанном периоде. |
Последнее значение | Использует последнее значение метрики в указанном периоде. Если значения метрики не удалось получить, Yandex Monitoring меняет статус алерта на No data . |
Максимум | Использует максимальное значение метрики в указанном периоде. |
Минимум | Использует минимальное значение метрики в указанном периоде. |
Сумма | Вычисляет сумму значений за указанный период для каждой метрики. |
Например, чтобы следить за последним значением метрики, которое было в течение последних 15 минут, необходимо выбрать функцию Последнее и задать окно вычисления 15m
.
Функция сравнения
Функция сравнения применяется к результату вычисления функции агрегации и пороговым значениям Warning и Alarm. Если агрегированное значение удовлетворяет пороговому, Monitoring изменяет статус алерта.
Warning
Пороговое значение, при достижении которого алерт перейдет в статус Warning
.
Alarm
Пороговое значение, при достижении которого алерт перейдет в статус Alarm
.
Окно вычисления
Временной период, в котором рассчитывается функция агрегации. Окно позволяет исключить резкие изменения значения метрик, реагируя только на изменения за больший промежуток времени.
Можно выбрать одно из предустановленных значений или задать свое в следующем формате:
1h
— 1 час.1m
— 1 минута.1s
— 1 секунда.
Например, значение 3m 45s
задает временное окно в 3 минуты 45 секунд.
Задержка вычисления
Cдвиг временного окна назад во времени в секундах. По умолчанию равен 0. Позволяет исключить неожиданное срабатывание алерта в тех случаях, когда в запросах используются метрики, которые собираются с разным интервалом. Можно выбрать одно из предустановленных значений или задать свое аналогично окну вычисления.
Обработка отсутствия данных
Политики определяют, в какой статус алерт перейдет при отсутствии точек во временном окне или отсутствии метрик по заданному селектору. Политики применяются до вычисления условий срабатывания и исходя из результата алерт переходит в указанный в настройках статус.