Построение самодиагностики и этапы эволюции мониторинга в живой высоконагруженной системе
Доклад принят в программу конференции
Целевая аудитория
Тезисы
В технических платформах телекома требуется высочайший уровень надежности, а минута простоя чревата большими бизнес- и репутационными потерями. Необходимо не только мониторить состояние серверов и программных компонентов, но и оперативно реагировать на изменения в их поведении.
В своем докладе я расскажу, как мы для смс-платформы построили систему самодиагностики на основании продуктовых метрик, про выбор этих метрик и эволюционный путь от простых алертов до самообучающейся системы по принятию решений.
Руководит разработкой highload-проектов.
С 2005 года работал разработчиком, тимлидом, управлял собственной web-студией.
За эти годы наблюдал появление и закат множества технологий.
С 2016 года только руководит командами, строит разработку с нуля.
В компании МТС с нуля реализовал проект высоконагруженной омниканальной платформы, для маршрутизации смс-трафика в различные каналы, в том числе и популярные мессенджеры.
МТС Digital
Видео
Другие доклады секции
DevOps и эксплуатация