Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Построение самодиагностики и этапы эволюции мониторинга в живой высоконагруженной системе

DevOps и эксплуатация

Мониторинг

Доклад принят в программу конференции

Целевая аудитория

Разработчики junior+, DevOps-инженеры, тестировщики, специалисты техподдержки.

Тезисы

В технических платформах телекома требуется высочайший уровень надежности, а минута простоя чревата большими бизнес- и репутационными потерями. Необходимо не только мониторить состояние серверов и программных компонентов, но и оперативно реагировать на изменения в их поведении.

В своем докладе я расскажу, как мы для смс-платформы построили систему самодиагностики на основании продуктовых метрик, про выбор этих метрик и эволюционный путь от простых алертов до самообучающейся системы по принятию решений.

Глеб Тильтиков

МТС Диджитал

Руководит разработкой highload-проектов.
С 2005 года был разработчиком, тимлидом, управлял собственной web-студией. Наблюдал появление и закат множества технологий.
С 2016 года только руководит командами, строит разработку с нуля.
В компании МТС реализовал проект высоконагруженной омниканальной платформы для маршрутизации СМС-трафика в различные каналы, в том числе и популярные мессенджеры.

МТС Диджитал

МТС — мультисервисная цифровая экосистема и ведущий телеком-оператор в России. Компания развивает сервисы и продукты в сфере больших данных, искусственного интеллекта, облачного хранения, медиа и финансов, телекоммуникаций. Штат IT-специалистов превышает 10 тыс. человек.

Видео

Другие доклады секции

DevOps и эксплуатация