SRE-трансформация в SmallTech: эволюция от хаоса инцидентов к автоматизированной наблюдаемости и предсказуемым SLA

SRE и эксплуатация систем

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

* SRE-инженеры, DevOps, руководители IT-отделов. * Специалисты по мониторингу и инцидент-менеджменту. * Команды, сталкивающиеся с масштабированием инфраструктуры или переходом от ad-hoc-решений к стандартизированным процессам.

Тезисы

* Как small-tech эволюционировала от фиксации инцидентов в Excel к централизованной системе наблюдаемости с метриками, логами и трейсингом.
* Внедрение SLO/SLI на основе собственной метрики «негативное влияние» для измерения качества сервисов.
* Автоматизация управления инцидентами: от ручной эскалации к чат-ботам и AI-ассистентам.
* Трансформация дежурных администраторов в команду оперативного реагирования с четкими SLA.
* Практические кейсы: снижение MTTR с 4 до 1,5 часа, рост доступности сервисов до 99,9%.

Антон Скутин

Петрович-Тех

Business Relationship & Service Level manager. За 6 лет в «Петровиче» прошел путь от техподдержки до строительства направления Service Design с нуля. Амбассадор ITIL в «Петрович-Техе», автор блога в TG: @brmtalk.

Видео

Другие доклады секции

SRE и эксплуатация систем