Как делать эффективные дашборды для 2000+ микросервисов?

Эксплуатация систем

Микросервисы, SOA
Логирование и мониторинг

Доклад принят в программу конференции

Целевая аудитория

Разработчики уровня Middle+ и Senior, ТехЛиды, SRE-инженеры

Тезисы

Техплатформа Городских сервисов обеспечивает работу Яндекс Такси, Еды, Лавки и Доставки. Для каждого из этих направлений важна стабильность и надежность. И поэтому один из ключевых аспектов проектирования дашбордов для более чем 2000 микросервисов – их роль в диагностике и расследовании инцидентов. Дашборды должны помогать оперативно выявлять проблемы и их причины, что позволяет ускорить реакцию на инциденты и минимизирует время простоя. В этом контексте важно не только предоставить пользователям данные о текущем состоянии системы, но и организовать информацию так, чтобы она помогала быстро разобраться в ситуации и найти источник проблемы.
В своём докладе я подробно остановлюсь на следующих пунктах:
1. Кто и как пользуется микросервисными дашбордами
2. Как генерируются дашборды для микросервисов
3. Какие требования мы предъявляем к дашбордам
4. Как выглядит дашборд микросервиса в Городских сервисах Яндекса

Алексей Золотухин

Техплатформа Городских сервисов Яндекса

Разработчик в Группе разработки компонентов диагностики

Видео