Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Как мы делаем трейсинг в условиях тысяч сервисов и миллионов спанов в секунду

Platform Engineering

Профайлинг, логирование

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Игорь расскажет о внедрении трейсинга в Авито: с какими трудностями столкнулись в процессе и как их решали, о сценариях применения собственного observability-инструмента для анализа трейсов и почему не подошли существующие на рынке решения.

Целевая аудитория

Все, кто слышал про трейсинг и им интересна данная технология. Те, кто только присматриваются к трейсингу, узнают дополнительные сценарии его применения и смогут лучше осознать его пользу и стоимость внедрения. Тем, кто уже начал использовать трейсинг, расскажу, как мы стараемся сохранить удобство и возможности инструмента в условиях большого масштаба и невозможности хранить все данные.

Тезисы

Поговорим о трейсинге в Авито: какую он задачу решает, и как у нас выглядит архитектура трейсинга, обрабатывающая миллионы спанов в секунду от нескольких тысяч сервисов, объединенных в service mesh (который, как оказалось, помогает). Расскажем, как мы меняли подходы к семплированию данных и почему мы ушли от Jaeger к OpenTelemetry и собственному инструменту, объединяющему трейсинг, логи и метрики.

Рассмотрим примеры из нашего опыта, когда трейсинг ускоряет нахождение проблем и отладку в распределенной среде, и попробуем ответить на вопрос: «Зачем нужен трейсинг, и какая цена у его внедрения?».

Сейчас занимается service mesh, логами, трейсингом и помогает развивать PaaS в Авито.
Старается хотя бы раз в день применять YAML-манифест в Kubernetes.

Авито

На Авито каждый может найти что-то своё среди миллионов частных объявлений и предложений компаний. У нас десятки тысяч rps к бэкенду, терабайты картинок в хранилище и мощная система автоматизированной модерации на базе машинного обучения. Каждый месяц сервисом пользуется треть населения России.

Видео