Devops: предиктивный мониторинг, отказоустойчивый мониторинг
На стенде наши эксперты ответят на все ваши вопросы про предиктивный мониторинг и отказоустойчивый мониторинг.Как это работает в СберМаркете: у нас есть ML-сервис, который мы заопенсорсили, где настраиваются метрики, по которым требуется предиктивная оценка, ML-сервис на Python. Сервис работает на основе метрик Prometheus, учитывает сезонность, выходные и т.д., а под капотом библиотека prophet.
О чем расскажем:
· Предсказание того, что будет: нагрузка, кол-во заказов
· Как в условиях нестатических нагрузок мониторить атаки
· Как мониторить не причины, а следствия
· Как принимать 50 млн рядов и не умереть
· Как сделать, чтобы 50 млн рядов не разлетелись
· Как можно обезопасить себя от бесконтрольного разрастания метрик
Эксперты
Дмитрий Крапивин
Руководитель базовой инфраструктуры в СберМаркете, SRE инженер с 10-летним опытом.
Илья Кочнев
Руководитель отдела ИТ-инфраструктуры в СберМаркете
Сергей Реусин
Руководитель группы обеспечения надёжности в СберМаркете.
Андрей Иванов
Руководитель группы эксплуатации внутреннего ИТ в СберМаркете
Место проведения – стенд СберМаркет