Учим тушить инциденты, а не исполнять SRE ритуалы.

SRE и эксплуатация систем

Отказоустойчивость
Распределенные системы
Управление инцидентами
Практики программирования
Логи, метрики, ошибки

Доклад принят в программу конференции

Целевая аудитория

Лиды команд. Все, кто заинтересован в уменьшении потерь от ицнидентов. Все, кто отвечает за проведение мероприятий для разработчиков.

Тезисы

В наше время существует очень много практик по предотвращению инцидентов и по ведению процессов вокруг них. Однако, никто не умеет учить самому ТУШЕНИЮ инцидентов.

Поделимся взглядом на обучение, непосредственно, тушению инцидентов. Придумаем новый формат активности для разработчиков, который поможет прокачать навыки в этом направлении.

Расскажем результаты публичных тестов нового формата активности и разберем один из тасков с игры.

6 лет в айти. Закончил ШАД на инфраструктурном треке. Прошел путь от стажера питониста до ведущего гошника. Сейчас занимаюсь разработкой системы мониторинга в ВК. Помимо работы хожу в качалку и занимаюсь джиу джитсу.

Видео