Как мы строили систему телеметрии на opensource в ecom.tech: OpenTelemetry, Qryn и Coroot

Эксплуатация систем

Логирование и мониторинг
Производительность и мониторинг фронтенда
Observability в enterprise
Логи, метрики, ошибки
Оптимизация
DevOps / SRE
Инфраструктура

Доклад принят в программу конференции

Целевая аудитория

SRE и DevOps-инженеры, backend-инженеры и техлиды

Тезисы

Доклад, который будет интересен SRE и DevOps-инженерам, бэкенд-разработчикам и техлидам. Поговорим о телеметрии: OpenTelemetry, Qryn и Coroot. Как внедрять, как расследовать инциденты, и как сделать свою высоконагруженную систему с̶ч̶а̶с̶т̶л̶и̶в̶о̶й̶ работающей. Обсудим и расскажем на конкретных кейсах:

- Как менять инфраструктуру под действием внешних факторов, оставаясь доступными пользователю?
– Как использовать опенсорс в высоконагруженных средах, выбирая лучшее для себя?
– Как превращать трейсы и логи в метрики?
– Как анализировать аномалии и дебажить инциденты?

PTL платформы Observability в ecom.tech. Работал с Elasticsearch/Opensearch, Zabbix, OpenTelemetry. Занимаюсь доставкой логов и трейсов.
Я Тзинча слуга, я раб колдовства!

Видео