Devops: предиктивный мониторинг, отказоустойчивый мониторинг
Доклад принят в программу конференции
Целевая аудитория
Тезисы
На стенде наши эксперты ответят на все ваши вопросы про предиктивный мониторинг и отказоустойчивый мониторинг.
Как это работает в СберМаркете: у нас есть ML-сервис, который мы заопенсорсили, где настраиваются метрики, по которым требуется предиктивная оценка, ML-сервис на Python. Сервис работает на основе метрик Prometheus, учитывает сезонность, выходные и т.д., а под капотом библиотека prophet.
О чем расскажем:
- Предсказание того, что будет: нагрузка, кол-во заказов
- Как в условиях нестатических нагрузок мониторить атаки
- Как мониторить не причины, а следствия
- Как принимать 50 млн рядов и не умереть
- Как сделать, чтобы 50 млн рядов не разлетелись
- Как можно обезопасить себя от бесконтрольного разрастания метрик
Руководитель базовой инфраструктуры в СберМаркете, SRE-инженер с 10-летним опытом.
СберМаркет
Руководитель отдела ИТ-инфраструктуры в СберМаркете
20 лет в IT из них последних 7 в DevOps и руководстве командами.
Опыт проектирования и построения инфраструктур как в облаках так и on-premise в Российских и международных компаниях.
СберМаркет
Руководитель группы обеспечения надёжности в СберМаркете.
Последние 5 лет занимаюсь эксплуатацией, проектированием и разработкой систем в тесном взаимодействии с продуктовыми командами: развиваем технические и бизнес-метрики, работаем с инцидентами, учимся лучше понимать окружающий нас мир.
СберМаркет
Руководитель группы эксплуатации внутреннего ИТ в СберМаркете
Строит мосты между эксплуатацией и разработкой.
СберМаркет
Видео
Другие доклады секции
Экспертная зона