Root cause analysis monitoring

DevOps и эксплуатация

DevOps и эксплуатация

Java
Python
PostgreSQL
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
GO
Observability в enterprise
Надёжность продакшена
Логи, метрики, ошибки

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как уменьшить шум в алертах и увеличить их полезность? Можно договориться, какие алерты оставить, а какие отключить как шум, а можно построить дерево алертов и рассылать только ключевые, а остальные оставлять как дополнительные индикаторы. В докладе рассказывается о применении такого подхода.

Целевая аудитория

Девопсы и разработчики.

Тезисы

Базы данных, очереди, приложения на Spring и много чего еще, и все это в тысячах экземпляров — чем сложнее инфраструктура, тем выше вероятность возникновения ошибок. Своевременно исправлять ошибки (а ещё лучше — предсказывать их возникновение и своевременно реагировать) — одна из главных задач провайдера облачных сервисов или владельца собственной крупной инфраструктуры.

Поделимся тем, как мы используем графы в задачах мониторинга и observability и как Root Cause Analysis в мониторинге помогает командам эксплуатации.

Как и многие другие вендоры ПО, 1С давно предлагает свои продукты в облачном варианте. Это, в первую очередь, наши облачные сервисы 1С:ГРМ (Готовое Рабочее Место) и 1cFresh. Предоставление облачных сервисов требует наличия соответствующей инфраструктуры — прежде всего серверов, на которых размещаются виртуальные машины с приложениями, и софта, управляющего физическими и виртуальными машинами.

Руководитель группы разработки облачных технологий и сервисов.

Фирма «1С» — это разработка и дистрибуция программ и IT-сервисов для автоматизации и цифровизации бизнеса. Более 10 тысяч партнёров в 30 странах. Инновационная технологическая платформа 1С:Предприятие — сочетание комплекса инструментов и технологий (fullstack-platform), позволяющего создавать высоконагруженные кроссплатформенные бизнес-решения различной сложности, и концепции low-code, позволяющей вести быструю разработку. Платформу 1С используют для создания и кастомизации бизнес-приложений более 300 тысяч IT-специалистов. Более 1 300 тиражных решений на базе платформы 1С:Предприятие (ERP, CPM, MES, CRM, WMS, BPM, ECM и др) применяют свыше 1,5 миллиона организаций от малого бизнеса до крупнейших корпораций и госструктур.

Видео