Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

История одного инцидента: как парализовать работу 20к сотрудников и организовать чемпионат по игре в тетрис

DevOps-практики и культура

Эксплуатация систем / DevOps-практики и культура

Бэкенд / другое
Управление инцидентами

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Многие из нас любят послушать доклады про чужие инциденты — это как раз один из таких. Попутно Эдуард расскажет про архитектуру и observability в Yandex Tracker.

Целевая аудитория

Backend-разработчики, DevOps, SRE.

Тезисы

Постмортем инцидента во внутренней инсталляции Yandex Tracker.

Расскажем, как устроен инцидент-менеджмент, как мы обнаруживаем инциденты и реагируем на них, что делаем, чтобы инциденты не повторялись. Покажем, почему стабильность сервиса — это процесс, а не результат.

Бэкенд-разработчик Yandex Tracker.
Посмотрел 15 сезонов «Расследований авиакатастроф» и стремится, чтобы процессы в разработке и эксплуатации программных систем были такими же развитыми, как и в авиаиндустрии.

Yandex Infrastructure

Команда Yandex Infrastructure создает системы, сервисы и инструменты для разработчиков Яндекса. Их решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру на всех этапах производства: у них есть собственная система контроля версий для хранения исходного кода, системы распределённой сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, система ревью кода, распределённая система выполнения задач, системы развертывания и мониторинга приложений. Также разрабатывают продукты для поддержки процессов разработки, планирования ресурсов и много других систем и инструментов.

Видео