Настроить алерты
Алертинг позволяет следить за изменениями в метриках и отправлять уведомления, когда показатели достигают критических значений. Изменения в метриках отслеживаются с помощью периодически отправляемых запросов — алертов. Когда они достигают пороговых значений, система отправляет уведомление через указанный канал связи. Например, по электронной почте или в мессенджер.
Чтобы настроить алертинг:
- Создайте канал уведомлений.
- Выберите метрики и метки для контроля.
- Создайте алерт.
Рассмотрим пример создания алерта о недоступности сервиса.
Алерт будет срабатывать, когда количество неуспешных запросов составляет 50% и более от общего количества запросов. Такой алерт поможет выявить DDoS-атаки или сбои в работе инфраструктуры.
Обозначим буквами количество входящих запросов в секунду:
A— общее количество запросов.
B— количество неуспешных запросов.
Настроим алерты:
Bсоставляет 30% от
A— предупреждение (
Warning);
Bсоставляет 50% от
A— критический уровень (
Alarm).
Создание канала уведомления
-
В консоли управления слева выберите каталог.
-
Выберите сервис Monitoring.
-
Выберите раздел Каналы уведомлений.
-
Нажмите Создать канал.
-
Укажите имя канала, метод отправки и получателей.
Примечание
Чтобы получать уведомления, пользователь должен:
- иметь роль
monitoring.viewerна каталог, в котором настроен алерт.
- в настройках консоли управления:
- включить опцию Мониторинг;
- указать адрес электронной почты, номер телефона и Telegram-аккаунт или группу.
- иметь роль
-
Нажмите Создать.
Выбор метрик для контроля
- Величину
Aбудем получать с помощью метрики
load_balancer.requests_count_per_second.
- Величину
Bбудем получать с помощью метрики
load_balancer.requests_count_per_second, отфильтровав по метке
code=
503.
- Долю
Bот
Aбудем вычислять как
100 * B / Aи сохранять в значении
C.
Создание алерта
-
На странице сервиса Monitoring нажмите Создать алерт.
-
Введите название алерта, например,
unavailable_service.
-
В блоке Настройки алерта опишите запрос для получения
A:
- Напротив значка добавьте параметры:
service=
Application Load Balancer;
name=
load_balancer.requests_count_per_second;
load_balancer=
<имя_балансировщика_нагрузки>.
-
- Напротив значка задайте функцию для обработки данных
replace_nan(0)— замена пропусков данных на значение
0, чтобы график был непрерывным.
- Напротив значка добавьте параметры:
-
Нажмите Добавить запрос.
-
Опишите запрос для получения
B:
- Укажите данные для сбора:
service=
Application Load Balancer;
name=
load_balancer.requests_count_per_second;
code=
503;
load_balancer=
<имя_балансировщика_нагрузки>.
-
- Задайте функцию
replace_nan(0).
- Укажите данные для сбора:
-
Нажмите Добавить запрос.
-
Опишите запрос
Cдля получения доли
Bот
Aв процентах:
- Нажмите , чтобы переключиться в текстовый режим редактирования запроса.
- В строке запроса введите
100 * B / A.
-
В блоке Условия срабатывания укажите:
Запрос для проверки—
C.
Функция агрегации—
Все значения.
Warning—
30(предупреждение).
Alarm—
50(критический уровень).
Окно вычисления—
30 секунд.
Задержка вычисления—
15 секунд.
-
-
В блоке Обработка отсутствия данных оставьте значения по умолчанию.
-
(опционально) В блоке Аннотации добавьте информацию, которую следует записывать при срабатывании алерта.
-
В блоке Уведомления добавьте канал для отправки уведомления.
-
Нажмите Создать.