- Главная
- →
- DevOps и эксплуатация
Инцидент-менеджмент в Badoo DevOps и эксплуатация
Руководит отделом мониторинга, ответственен за написание постмортемов и ведение инцидентов. В свободное время делает что-нибудь интересное для Zabbix.
Тезисы
Технологические команды разного размера рано или поздно сталкиваются с тем, что возникающие проблемы становится сложнее контролировать. Какие-то события возникают сами по себе, какие-то – "благодаря" человеческому вмешательству, – или что-то идёт не так после заранее запланированных работ.
Всё это приводит к тому, что страдают и пользователи (потому что у них что-то не работает), и сотрудники (потому что им приходится тратить больше времени на выяснение причин случившегося).
В своём докладе я расскажу про эволюцию того, как мы в Badoo контролировали инциденты, какие методы позволяют нам минимизировать временные затраты для решения возникающих проблем и что мы делаем после того, как их локализовали.