Конференция завершена. Ждем вас на HighLoad++ Foundation в следующий раз!

Построение самодиагностики и этапы эволюции мониторинга в живой высоконагруженной системе

Мониторинг

Доклад принят в программу конференции

Тезисы

В технических платформах телекома требуется высочайший уровень надежности, а минута простоя чревата большими бизнес- и репутационными потерями. Необходимо не только мониторить состояние серверов и программных компонентов, но и оперативно реагировать на изменения в их поведении.

В своем докладе я расскажу, как мы для смс-платформы построили систему самодиагностики на основании продуктовых метрик, про выбор этих метрик и эволюционный путь от простых алертов до самообучающейся системы по принятию решений.

Руководит разработкой highload-проектов.
С 2005 года работал разработчиком, тимлидом, управлял собственной web-студией.
За эти годы наблюдал появление и закат множества технологий.
С 2016 года только руководит командами, строит разработку с нуля.
В компании МТС с нуля реализовал проект высоконагруженной омниканальной платформы, для маршрутизации смс-трафика в различные каналы, в том числе и популярные мессенджеры.

Видео