HighLoad++ 2022

Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Назад к списку экспертов

Devops: предиктивный мониторинг, отказоустойчивый мониторинг

На стенде наши эксперты ответят на все ваши вопросы про предиктивный мониторинг и отказоустойчивый мониторинг.Как это работает в СберМаркете: у нас есть ML-сервис, который мы заопенсорсили, где настраиваются метрики, по которым требуется предиктивная оценка, ML-сервис на Python. Сервис работает на основе метрик Prometheus, учитывает сезонность, выходные и т.д., а под капотом библиотека prophet.
О чем расскажем:
· Предсказание того, что будет: нагрузка, кол-во заказов
· Как в условиях нестатических нагрузок мониторить атаки
· Как мониторить не причины, а следствия
· Как принимать 50 млн рядов и не умереть
· Как сделать, чтобы 50 млн рядов не разлетелись
· Как можно обезопасить себя от бесконтрольного разрастания метрик

Эксперты

Дмитрий Крапивин

Дмитрий Крапивин

Руководитель базовой инфраструктуры в СберМаркете, SRE инженер с 10-летним опытом.

Илья Кочнев

Илья Кочнев

Руководитель отдела ИТ-инфраструктуры в СберМаркете

Сергей Реусин

Сергей Реусин

Руководитель группы обеспечения надёжности в СберМаркете.

Андрей Иванов

Андрей Иванов

Руководитель группы эксплуатации внутреннего ИТ в СберМаркете

Место проведения – стенд СберМаркет