Архитектура сбора продакшн-трафика для нагрузочного тестирования: 10 000 микросервисов и 30 млрд запросов в Ozon

Производительность enterprise-систем

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как собрать трафик в реальном времени с 10 000 микросервисов в Озон для ежедневных нагрузочных тестов, превращая 30 млрд запросов в супероружие для проверки системы. Докладчик поделится практическими решениями и реальными инсайтами по организации масштабируемой системы сбора трафика.

Целевая аудитория

С точки зрения технологий — инженеры и архитекторы высокопроизводительных систем. С точки зрения предметной области — разработчики инструментов нагрузочного тестирования,

Тезисы

Скачать презентацию Все презентации конференции

В Ozon нагрузочное тестирование проводится по продакшн-окружению, используя реальные запросы пользователей. Одна из проблем — все эти запросы собрать. Мы это делаем, клонируя трафик с других сервисов. И если другие сервисы держат нагрузку только от их пользователей, то наш сервис держит суммарную нагрузку сотен сервисов.

В своем докладе я расскажу про: * первую версию архитектуры, державшую нагрузку в тысячи раз меньше текущей; * сложности, с которыми мы столкнулись. В частности, как положили Kafka для части сервисов; * развитие архитектуры вплоть до текущей версии, выдерживающей 1 500 000 RPS; * как мы ежедневно записываем 20 терабайт трафика; * зачем мы это делаем.

Евгений Кузышин

Ozon

Тимлид. Руководил продуктовыми командами до 16 человек в пике.
Развил платформу нагрузочного тестирования в Ozon.
Сейчас занимается разработкой средств контроля.