Профессиональная конференция разработчиков высоконагруженных систем

Управление инцидентами в СберМаркете

DevOps и эксплуатация

Управление инцидентами
Методологии

Доклад отозван

Целевая аудитория

Разработчики, инженеры, и все, кто сталкиваются с инцидентами

Тезисы

Доклад о том, как мы управляем инцидентами и проблемами в СберМаркете: для чего и для кого построен процесс, какие задачи решает, как работает процесс с момента регистрации самого инцидента до закрытия проблемы.

Как мы приоритизируем, категоризируем, эскалируем инциденты, о ролях в команде по решению, инструментах, которые помогают нам в быстром решении самых непростых и неприятных сбоев, рассматривая конкретные методики и инструменты, используемые в компании. Как сделать правильные выводы по мотивам каждого такого сбоя и, если не полностью исключить риски повторения, то хотя бы свести эти риски к минимуму, научиться быстрее реагировать и эффективные решать подобные аварии.

За относительно недолгий срок существования процесса в СберМаркете мы смогли достичь значительных успехов: сократили среднее время решения крупных сбоев практически вдвое и уменьшили долю финансовых потерь от оборота примерно в 6 раз.
Посмотрим на метрики, расскажем об успехах и зонах роста, поделимся планами по дальнейшему развитию процесса.

Максим Бурцев

СберМаркет

Руководитель группы управления инцидентами – отвечаю за практики и процессы управления инцидентами и проблемами в Сбермаркете.

СберМаркет

СберМаркет (ООО «Инстамарт Технолоджис») — технологический онлайн-сервис, который помогает делать покупки не выходя из дома. Tech-команда СберМаркета создает один из самых сложных высоконагруженных e-commerce-проектов в России и делает это с любовью.

Видео