Наблюдательный пост пессимиста: технические и концептуальные решения в системе мониторинга Lamoda DevOps и эксплуатация
Доклад принят в программу конференции
Тезисы
Закон Мёрфи гласит, что всё, что может пойти не так, пойдет не так, и я, как ответственный за большую, нагруженную нетривиальной бизнес-логикой систему, хотел бы знать о таких вещах заранее.
В своем докладе расскажу о том, как мы готовим prometheus/thanos/redis/icinga/tg bots/slack/grafana/sentry, как следим за Kubernetes-кластером и базами данных, как заводим новые метрики, как мониторим бизнес-показатели, как предвещаем провалы, начиная от заканчивающегося автоинкремента в базах до роста количества ошибок при подтверждении заказов. Доклад охватит и бэк, и мобильные приложения.
Другие доклады секции DevOps и эксплуатация
Нормально делай - нормально будет. Готовим рабочие нагрузки в AWS так, чтобы не было стыдно людям в глаза смотреть
Карен Товмасян
EPAM
Оператор в Kubernetes для управления кластерами БД - архитектура и функционирование. На примере clickhouse-operator
Владислав Клименко
Altinity
AnalyticOps: конвейеры для поставки моделей машинного обучения в промышленную эксплуатацию
Антон Задорожный
Teradata
“Восстание машин” – это ок
Леонид Талалаев
Одноклассники