Мониторинг состояния инстанса Managed Service for GitLab
Примечание
Функциональность находится на стадии Preview.
Данные о состоянии инстанса можно посмотреть на вкладке Мониторинг страницы инстанса или в сервисе Yandex Monitoring.
Диагностическая информация о состоянии инстанса представлена в виде графиков. На них автоматически применяются наиболее подходящие кратные единицы измерения (гигабайты, проценты и т. д.).
Вы можете настроить алерты в сервисе Yandex Monitoring для получения уведомлений о сбоях в работе кластера. В Yandex Monitoring используются два порога срабатывания алерта: Warning
и Alarm
. При превышении заданного порога вы получите оповещения через настроенные каналы уведомлений.
Мониторинг состояния инстанса
Для просмотра детальной информации о состоянии инстанса Managed Service for GitLab:
- Перейдите на страницу каталога
и выберите сервис Managed Service for GitLab. - Нажмите на имя нужного инстанса и выберите вкладку Мониторинг.
-
Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в Monitoring на панели сверху.
На странице появятся следующие графики:
- Data disk — количество занятого и свободного места на диске для хранения данных.
- System disk — количество занятого и свободного места в системном хранилище.
- CPU — загрузка процессорных ядер.
- Memory — использование оперативной памяти. При высоких нагрузках значение параметра Available memory уменьшается, а Used memory — растет.
Настройка алертов в Monitoring
-
В консоли управления
выберите каталог с инстансом, для которого нужно настроить алерты. -
В списке сервисов выберите
Monitoring. -
На главной странице в блоке Сервисные дашборды выберите Managed Gitlab.
-
На нужном графике нажмите на значок
и выберите пункт Создать алерт. -
Если на выбранном графике несколько показателей, в разделе Настройки алерта вы можете оставить все запросы данных или только некоторые из них. Например, для метрики System disk можно удалить лишний запрос на свободное место в хранилище и оставить только запрос на занятое место.
Чтобы убрать лишний запрос, в его строке нажмите
→ Удалить.Подробнее о языке запросов см. документацию Monitoring.
-
Задайте условия срабатывания алерта:
-
Задайте имя запроса, по которому будет вычисляться статус алерта.
-
Выберите функцию агрегации, которая будет применяться к значениям метрик во временном окне.
-
Выберите функцию сравнения, которая будет сравнивать результат функции агрегации и пороговые значения.
-
Укажите значения порогов
Warning
иAlarm
. Выберите, должно ли текущее значение на графике быть больше, меньше установленного порога или равно ему. -
Задайте временное окно, в котором рассчитывается алерт, и задержку вычисления.
-
-
Нажмите кнопку Создать.
Вы также можете создать алерты на конкретные метрики Managed Service for GitLab.
Рекомендуемые значения порогов для некоторых метрик:
Рекомендуемые значения порогов для метрики Оставшееся свободное место на диске (sys.filesystem.FreeB
):
- Функция агрегации — Среднее.
- Функция сравнения — Меньше или равно.
- Alarm — 7% от размера хранилища.
- Warning — 10% от размера хранилища.
- Окно вычисления — 5 минут.
- Задержка вычисления — 30 секунд.
Статусы инстанса
Статус показывает, запущен ли инстанс, остановлен или находится в промежуточном состоянии. Статус можно посмотреть в списке инстансов Managed Service for GitLab и на странице каждого инстанса.
Возможные статусы:
Статус |
Описание |
Предлагаемые действия |
CREATING |
Идет подготовка к первому запуску |
Подождите немного и приступайте к работе. Время создания инстанса зависит от класса хостов. |
RUNNING |
Инстанс работает в штатном режиме |
Действий не требуется. |
STOPPING |
Инстанс останавливается |
Через некоторое время инстансу будет присвоен статус |
STOPPED |
Инстанс остановлен |
Запустите инстанс, чтобы вернуть его в работу. |
STARTING |
Остановленный ранее инстанс запускается |
Через некоторое время инстансу будет присвоен статус |
UPDATING |
Выполняется обновление инстанса |
По завершении обновления ему будет присвоен статус |
ERROR |
Произошла ошибка, которая не позволяет инстансу продолжить работу |
Выполните начальную диагностику:
Если причины ошибки не удалось выяснить самостоятельно, обратитесь в службу поддержки |
STATUS_UNKNOWN |
Инстанс не может определить свой статус |
Выполните начальную диагностику:
Если причины ошибки не удалось выяснить самостоятельно, обратитесь в службу поддержки. |
DELETING |
Инстанс удаляется |
По завершении удаления инстанс исчезнет со страницы Список инстансов и больше не будет доступен. Действий не требуется. При удалении инстанса автоматически создается резервная копия, которая хранится в течение двух недель. Если после удаления нужно восстановить инстанс, обратитесь в службу поддержки. |