Чем мы смотрим на прод Яндекса, и как это вам поможет
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Расскажу о том, как решение одной частной проблемы выросло в систему, с которой работает сотня команд и которая позволяет в режиме реального времени ответить на большинство вопросов про то, что происходит с продакшном. Мы объединили разбор ошибок клиентов и бэкендов, клиентскую скорость, телеметрию видео, клики по элементам интерфейсов, access_log сервисов, логи балансеров, CSP, CDN статики, CDN видео в общий набор инструментов, который позволяет навигироваться по более чем 150B событий в сутки. И еще фильтровать данные по произвольным срезам, строить графики, считать метрики, сравнивать сегменты, настраивать алерты.
Я поделюсь рецептом того, как мы собирали такую систему, а также приведу технические характеристики текущих кластеров. Хочу показать, что создание подобной системы внутри компании возможно и может быть сделано силами небольшого числа людей.
Больше 10 лет в Яндексе. Занимался разработкой главной страницы, Эфира, Дзена. Любит понимать то, что происходит в продакшне, с помощью метрик. Руководит несколькими командами разработки. Последние несколько лет изучает работу видео — от создания до воспроизведения.
Яндекс
Видео
Другие доклады секции
Архитектуры, масштабируемость