Настроить алерты
Алертинг позволяет следить за изменениями в метриках и отправлять уведомления, когда показатели достигают критических значений. Изменения в метриках отслеживаются с помощью периодически отправляемых запросов — алертов. Когда они достигают пороговых значений, система отправляет уведомление через указанный канал связи. Например, по электронной почте или в мессенджер.
Чтобы настроить алертинг:
- Создайте канал уведомлений.
- Выберите метрики и метки для контроля.
- Создайте алерт.
Рассмотрим пример создания алерта о недоступности сервиса.
Алерт будет срабатывать, когда количество неуспешных запросов составляет 50% и более от общего количества запросов. Такой алерт поможет выявить DDoS-атаки или сбои в работе инфраструктуры.
Обозначим буквами количество входящих запросов в секунду:
A— общее количество запросов.B— количество неуспешных запросов.
Настроим алерты:
Bсоставляет 30% отA— предупреждение (Warning);Bсоставляет 50% отA— критический уровень (Alarm).
Создание канала уведомления
-
В консоли управления
слева выберите каталог. -
Выберите сервис Monitoring.
-
Выберите раздел Каналы уведомлений.
-
Нажмите Создать канал.
-
Укажите имя канала, метод отправки и получателей.
Примечание
Чтобы получать уведомления, пользователь должен:
- иметь роль
monitoring.viewerна каталог, в котором настроен алерт. - в настройках
консоли управления:- включить опцию Мониторинг;
- указать адрес электронной почты, номер телефона и Telegram-аккаунт или группу.
- иметь роль
-
Нажмите Создать.
Выбор метрик для контроля
- Величину
Aбудем получать с помощью метрикиload_balancer.requests_count_per_second. - Величину
Bбудем получать с помощью метрикиload_balancer.requests_count_per_second, отфильтровав по меткеcode=503. - Долю
BотAбудем вычислять как100 * B / Aи сохранять в значенииC.
Создание алерта
-
На странице сервиса Monitoring нажмите Создать алерт.
-
Введите название алерта, например,
unavailable_service. -
В блоке Настройки алерта опишите запрос для получения
A:- Напротив значка добавьте параметры:
service=Application Load Balancer;name=load_balancer.requests_count_per_second;load_balancer=<имя_балансировщика_нагрузки>.
- Напротив значка задайте функцию для обработки данных
replace_nan(0)— замена пропусков данных на значение0, чтобы график был непрерывным.
- Напротив значка добавьте параметры:
-
Нажмите Добавить запрос.
-
Опишите запрос для получения
B:- Укажите данные для сбора:
service=Application Load Balancer;name=load_balancer.requests_count_per_second;code=503;load_balancer=<имя_балансировщика_нагрузки>.
- Задайте функцию
replace_nan(0).
- Укажите данные для сбора:
-
Нажмите Добавить запрос.
-
Опишите запрос
Cдля получения долиBотAв процентах:- Нажмите
, чтобы переключиться в текстовый режим редактирования запроса. - В строке запроса введите
100 * B / A.
- Нажмите
-
В блоке Условия срабатывания укажите:
Запрос для проверки—C.Функция агрегации—Все значения.Warning—30(предупреждение).Alarm—50(критический уровень).Окно вычисления—30 секунд.Задержка вычисления—15 секунд.
-
В блоке Обработка отсутствия данных оставьте значения по умолчанию.
-
(опционально) В блоке Аннотации добавьте информацию, которую следует записывать при срабатывании алерта.
-
В блоке Уведомления добавьте канал для отправки уведомления.
-
Нажмите Создать.