SRE-трансформация в SmallTech: эволюция от хаоса инцидентов к автоматизированной наблюдаемости и предсказуемым SLA

Резерв

Доклад принят в программу конференции

Целевая аудитория

📍SRE-инженеры, DevOps, руководители ИТ-отделов 📍Специалисты по мониторингу и инцидент-менеджменту 📍Команды, сталкивающиеся с масштабированием инфраструктуры или переходом от ad-hoc-решений к стандартизированным процессам

Тезисы

📍Как small-tech эволюционировала от фиксации инцидентов в Excel к централизованной системе наблюдаемости с метриками, логами и трейсингом
📍Внедрение SLO/SLI на основе собственной метрики «негативное влияние» для измерения качества сервисов
📍Автоматизация управления инцидентами: от ручного эскалации к чат-ботам и AI-ассистентам.
Трансформация дежурных администраторов в команду оперативного реагирования с четкими SLA
📍Практические кейсы: снижение MTTR с 4 часов до 1.5 часов, рост доступности сервисов до 99.9%

Антон Скутин

Петрович-Тех

Business Relationship & Service Level manager. За 6 лет в «Петровиче» прошел путь от техподдержки до строительства направления Service Design с нуля. Амбассадор ITIL в «Петрович-Техе», автор блога в TG: @brmtalk.

Видео