Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Построение самодиагностики и этапы эволюции мониторинга в живой высоконагруженной системе

DevOps и эксплуатация

Мониторинг

Доклад принят в программу конференции

Целевая аудитория

Разработчики junior+, DevOps-инженеры, тестировщики, специалисты техподдержки.

Тезисы

В технических платформах телекома требуется высочайший уровень надежности, а минута простоя чревата большими бизнес- и репутационными потерями. Необходимо не только мониторить состояние серверов и программных компонентов, но и оперативно реагировать на изменения в их поведении.

В своем докладе я расскажу, как мы для смс-платформы построили систему самодиагностики на основании продуктовых метрик, про выбор этих метрик и эволюционный путь от простых алертов до самообучающейся системы по принятию решений.

Руководит разработкой highload-проектов.
С 2005 года работал разработчиком, тимлидом, управлял собственной web-студией.
За эти годы наблюдал появление и закат множества технологий.
С 2016 года только руководит командами, строит разработку с нуля.
В компании МТС с нуля реализовал проект высоконагруженной омниканальной платформы, для маршрутизации смс-трафика в различные каналы, в том числе и популярные мессенджеры.

МТС Digital

МТС Digital — это IT-компания внутри крупнейшего телеком- оператора. У нас более 5000 IT-специалистов, есть startup hub и 12 профессиональных гильдий. В МТС Digital разные направления: от обработки больших данных, искусственного интеллекта и облачных сервисов до телемедицины и киберспорта, потому что мы создаем экосистему цифровых сервисов.

Видео

Другие доклады секции

DevOps и эксплуатация