Мониторинг как процесс, или Как перестать бояться и начать спать по ночам DevOps и эксплуатация
Доклад принят в программу конференции
Тезисы
В один прекрасный момент стало ясно, что наши алерты — это белый шум, который мешает, а не помогает находить проблемы в инфраструктуре. Тогда мы потратили пару месяцев и привели всё в порядок. Но через два года инфраструктура выросла в разы, а шума стало на порядок больше, появились инциденты из-за несвоевременной реакции на мониторинг. Опять повторять крестовый поход и полгода спать спокойно? Ну нет, нормально делай — нормально будет.
И это история о том, как мы перестроили процессы внутри команды, чтобы мониторинг перестал быть стихийным и стал актуальным и управляемым.
Другие доклады секции DevOps и эксплуатация
Внедрение SRE. Итоги 5 лет опыта
Павел Притчин
Dodo Engineering
Сквозное логирование с использованием транзакционных логов в Росгосстрахе
Александр Крылов
Лаборатория числитель
Есть ли жизнь без ELK? Как снизить стоимость Log Management, используя Kafka, ClickHouse и Vector
Денис Безкоровайный
Proto Group
Tarantool: от коммита до прода за 20 минут
Роман Проскин
Tarantool, VK