Яндекс запустил платформу для мониторинга и управления состоянием ИТ-систем компаний

04.03.2026
Yandex B2B Tech запустила платформу собственной разработки для анализа работы ИТ-систем в реальном времени (observability-платформу) Monium.

С ее помощью компании могут отслеживать состояние цифровых продуктов, приложений и ИИ-агентов в облачной и собственной инфраструктуре (on-premises). Платформа позволит бизнесу повысить стабильность сервисов. Monium доступна на облачной платформе Yandex Cloud для всех пользователей.

Monium поможет компаниям обнаружить инцидент в ИТ-системе и быстро понять его первопричину. С помощью Monium можно анализировать большое количество телеметрических данных, в том числе логов, трейсов и метрик в едином интерфейсе. На платформе есть гибкая система алертинга с возможностью настройки сценариев эскалаций и звонками.

Изначально Monium использовали для мониторинга критических сервисов внутри Яндекса. Платформа разработана командой Yandex Infrastructure. Monium создавался для решения практических задач – быстрого обнаружения инцидентов, анализа причин сбоев и работы с большими объемами телеметрических данных в условиях высокой нагрузки. Сейчас с платформой ежемесячно работают 16 тысяч сотрудников Яндекса. В систему ежесекундно записывается 3 миллиарда семплов метрик, 44 миллиона спанов и 60 гигабайт логов. Такие высокие нагрузки Monium способна выдерживать за счет того, что развернута на отказоустойчивой инфраструктуре, находящейся в дата-центрах Яндекса. Из внешних компаний платформу уже тестируют ОТП Банк и крупная FMСG-компания.

“Глубокая наблюдаемость и управление надежностью ИТ-инфраструктуры и надежностью ИТ-продуктов напрямую влияет на выручку компании. Например, простой e-commerce платформы всего на 1 час может стоить бизнесу миллионы рублей. Monium позволит минимизировать риски отказов, получить целостный анализ системы за секунды и своевременно сфокусировать команды как в штатной, так и в нештатной ситуации”, – рассказал Иван Пузыревский, технический директор платформы Yandex Cloud.

Платформа спроектирована с учетом реальных сценариев эксплуатации и интегрируется в существующую инфраструктуру. Платформа поддерживает Prometheus и OpenTelemetry (OTEL) как основной стандарт сбора телеметрии, что позволяет использовать единый подход к сбору метрик, логов и трассировок без привязки к конкретным вендорам. Monium использует современные механизмы аутентификации и авторизации. Cоответствует требованиям международных и российских стандартов безопасности, в том числе ISO, PCI DSS и ГОСТ Р 57580.

Похожие статьи