Профессиональная конференция разработчиков высоконагруженных систем

4 способа выявления сбоев узла в Kubernetes: актуальные стратегии возвращения рабочей нагрузки

DevOps и эксплуатация

Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
Надёжность продакшена
Облака
DevOps / Кубер
DevOps / SRE
Инфраструктура

Доклад отклонён

Целевая аудитория

DevOps, SRE

Тезисы

В докладе будут рассмотрены
- Описаны базовые механизмы обнаружения сбоев узлов и способы влияния на них
- Погрузимся в классический node-problem-detector и способы его кастомизации
- Операторы помогающие автоматизировать процессы
- А также различные системы на базе метрик: оборудования, сервисов, облака

Кроме того будет описан чек лист, описывающий как не допустить каскадный отказ сервиса

Старший DevOps Engineer

Lamoda Tech

Lamoda Tech — команда из более чем 900 человек, которые совершают цифровую революцию в fashion и e-commerce и делают моду ближе для миллионов пользователей.

Видео