Monitoring

Статья создана

Обновлена 2 июля 2026 г.

Интерфейс Grafana
Управление доступом
Дашборды метрик
Логи
Алерты
Конфигурация
- Общий вид

Stackland позволяет организовать мониторинг кластера и платформенных компонентов с помощью Prometheus, Loki, Fluent Bit и Grafana.

Prometheus — средство сбора метрик кластера и платформенных компонентов.
Loki — средство централизованного сбора логов.
Fluent Bit — средство поставки логов.
Grafana — интерфейс для просмотра и визуализации метрик и логов.
Alertmanager — средство управления правилами алертинга и отправки уведомлений о проблемах.

Вы можете расширить возможности мониторинга, добавив источники данных и плагины для работы с ними.

Интерфейс Grafana

Интерфейс Grafana доступен по адресу https://grafana.sys.<домен кластера>. Для входа используйте кнопку Sign in with Stackland Auth.

К интерфейсу уже подключены источники данных Loki и Prometheus. Чтобы добавить новые источники или проверить уже подключенные, откройте страницу Data sources во вкладке Connections. Чтобы увидеть, какие метрики и логи собираются в кластере, откройте вкладку Explore и выберите Metrics или Logs.

Управление доступом

В зависимости от роли в кластере пользователю будет назначаться глобальная роль в Grafana. Если пользователь входит в группу stackland-cluster-admins, то в Grafana пользователь сразу получит права администратора. Если входит в stackland-cluster-editors — роль editor. Если пользователь не состоит в группе, то он получит роль viewer.

После входа можно управлять правами на уровне отдельных ресурсов Grafana и отдельных пользователей. Подробнее об управлении доступами читайте в документации Grafana.

apiVersion: stackland.yandex.cloud/v1alpha1
kind: MonitoringConfig
metadata: ...
status:
  datasourceConfigured: true
  grafanaReady: true
  message: Grafana is ready
  observedGeneration: 1
spec:
  enabled: true
  settings:
    alertmanager:
      enabled: true
      ingressEnabled: true
      replicas: 2
      retention: 120h
      storage:
        storageClass: topolvm
        size: 1Gi
      resources:
        requests:
          cpu: 50m
          memory: 200Mi
    grafana:
      enabled: true
      resources:
        limits:
          cpu: 500m
          memory: 1Gi
        requests:
          cpu: 100m
          memory: 256Mi
    grafanaOperator:
      enabled: true
      resources:
        limits:
          cpu: 500m
          memory: 512Mi
        requests:
          cpu: 100m
          memory: 128Mi
    prometheus:
      enabled: true
      ingressEnabled: true
      replicas: 2
      resources:
        limits:
          memory: 2Gi
        requests:
          cpu: 100m
          memory: 400Mi
      storage:
        storageClass: topolvm
        size: 100Gi
      # Optional: extend the default HA read path with S3-backed long-term storage.
      # thanos:
      #   longTermStorage:
      #     stackland: {}

Состояние компонента мониторинга

status:
  datasourceConfigured: true
  grafanaReady: true
  message: Grafana is ready
  observedGeneration: 1

datasourceConfigured — Prometheus и Loki подключены к Grafana.
grafanaReady — Grafana готова к работе.
message — сообщение о состоянии Grafana.
observedGeneration — активная версия конфигурации.

Alertmanager

alertmanager:
  enabled: true
  ingressEnabled: true
  resources:
    requests:
      cpu: 50m
      memory: 200Mi

enabled — включает Alertmanager.
ingressEnabled — открывает доступ к Alertmanager через Ingress.
resources — требования к ресурсам.

Grafana

grafana:
  enabled: true
  resources:
    limits:
      cpu: 500m
      memory: 1Gi
    requests:
      cpu: 100m
      memory: 256Mi

enabled — включает Grafana.
resources — требования к ресурсам.

Grafana Operator

grafanaOperator:
  enabled: true
  resources:
    limits:
      cpu: 500m
      memory: 512Mi
    requests:
      cpu: 100m
      memory: 128Mi

enabled — включает Grafana Operator.
resources — требования к ресурсам.

Prometheus

prometheus:
  enabled: true
  ingressEnabled: true
  resources:
    limits:
      memory: 2Gi
    requests:
      cpu: 100m
      memory: 400Mi
  storage:
    size: 100Gi

enabled — включает Prometheus.
ingressEnabled — открывает веб-интерфейс Prometheus через Ingress.
resources — требования к ресурсам.
storage.size — размер PVC; локальная глубина истории ограничивается автоматически как 80% от размера PVC.

Monitoring

Интерфейс GrafanaИнтерфейс Grafana

Управление доступомУправление доступом

Дашборды метрикДашборды метрик

ЛогиЛоги

АлертыАлерты

КонфигурацияКонфигурация

Общий видОбщий вид

Состояние компонента мониторингаСостояние компонента мониторинга

AlertmanagerAlertmanager

GrafanaGrafana

Grafana OperatorGrafana Operator

PrometheusPrometheus

Была ли статья полезна?

Интерфейс Grafana

Управление доступом

Дашборды метрик

Логи

Алерты

Конфигурация

Общий вид

Состояние компонента мониторинга

Alertmanager

Grafana

Grafana Operator

Prometheus