Yandex Monium: платформа для мониторинга и управления состоянием IT-систем

С её помощью можно отслеживать состояние цифровых продуктов, приложений и ИИ-агентов расположенных как в облачной, так и в собственной инфраструктуре. Monium позволит бизнесу снизить количество ошибок и инцидентов и повысить стабильность сервисов.

Yandex Monium поможет компаниям не просто зафиксировать инцидент в IT-системе, а очень быстро понять его первопричину. Платформа собирает и анализирует большое количество телеметрических данных, в том числе логов, трейсов и метрик в едином интерфейсе. Их можно визуализировать в виде дашбордов и использовать для операционной и бизнес-аналитики. При возникновении проблемы Monium умеет оперативно отправлять ответственным дежурным автоматические уведомления через различные каналы: мессенджеры, почту, звонки и другие системы.

Yandex Monium находится в GA, на него действуют правила тарификации. На момент запуска Yandex Cloud Monitoring и Yandex Cloud Logging продолжат работать в старых интерфейсах, но мы будем вести постепенную коммуникацию о том, что вам нужно переходить в новый интерфейс.

Сначала Monium использовали для стабильной работы сервисов внутри компании. Сейчас с платформой ежедневно работают 16 тыс. сотрудников Яндекса, и она ежесекундно обрабатывает 3 миллиарда семплов метрик, 44 млн спанов, 60 ГБ логов в секунду, а также 22 млн алертов ежеминутно.

Такие высокие нагрузки Monium способна выдерживать за счёт того, что развёрнута на отказоустойчивой инфраструктуре, находящейся в дата-центрах Яндекса. Из внешних компаний платформу уже тестирует ОТП Банк.

Так работает LLM-мониторинг в Yandex Monium

Прозрачность и качественное управление IT-продуктами напрямую влияет на выручку компании. Если платформа электронной коммерции падает на один час, это может стоить миллионы рублей. Monium позволит минимизировать риски, получить целостный анализ инфраструктуры и сервисов за секунды и переключить IT-команды на фокусные задачи разработки.

Платформа спроектирована с учётом реальных сценариев эксплуатации и легко интегрируется в существующую инфраструктуру. Она поддерживает OpenTelemetry (OTEL) как основной стандарт сбора телеметрии — это позволяет легко интегрироваться с существующей инфраструктурой и использовать единый подход к сбору метрик, логов и трассировок без привязки к конкретным вендорам. Monium использует современные механизмы аутентификации и авторизации и соответствует требованиям международных и российских стандартов безопасности, в том числе ISO, PCI DSS и ГОСТ Р 57580.

По данным Gartner, к 2027 году 80% крупных компаний будут использовать observability-платформы как часть системы управления бизнес-рисками и доходами. В 2025 году 75% компаний отметили положительный экономический эффект от внедрения платформ IT-мониторинга.

author
Иван Пузыревский
Технический директор Yandex Cloud
Yandex Monium: платформа для мониторинга и управления состоянием IT-систем
Войдите, чтобы сохранить пост