Инциденты и коммуникация: что, как и зачем говорить, когда все сломалось Цифровая культура / CTO-трек
Алерт, инженеры уже смотрят логи, но прод лежит.
Все плохо.
Пользователи разрывают телефоны и мессенджеры, а большие боссы грозятся всех уволить.
В таких условиях трудно заниматься действительно важным — тушить пожар.
Я расскажу, как мы выстроили коммуникацию так, чтобы инциденты проходили максимально спокойно и ничто не отвлекало инженеров от спасения прода в кратчайшие сроки.
А еще о том:
* Как мы превратили пользователей в наших друзей и почему это очень полезно.
* Что мы говорим большим боссам, если диалог перестает быть конструктивным.
* Как общаемся внутри команды во время инцидентов.
* Как вспоминаем, что писать в постмортем.
* Что и зачем говорим, когда все работает.
* Как все это писать, чтобы читалось легко, а не как обычно.
И все это с примерами!