Transaction Outbox под нагрузкой: как не потерять ни одного события при 100k+ RPS

Архитектура и масштабируемость

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как гарантировать доставку каждого события при экстремальных нагрузках? В этом докладе разберем оптимизацию WAL, zero-copy публикацию и асинхронное чтение с реплик. Плюсом — когда Outbox превращается в антипаттерн. Только практика, а не теория!

Целевая аудитория

Разработчики распределенных систем, архитекторы, SRE.

Тезисы

Когда ваш сервис обрабатывает сотни тысяч транзакций в секунду, потеря даже одного события может стоить бизнесу миллионы. Transaction Outbox кажется простым паттерном, пока не начинает ломаться под реальной нагрузкой: WAL переполняется, реплики отстают на часы, а CDC-коннекторы падают от back-pressure.

Я помогаю масштабировать событийную архитектуру от тысяч до сотен тысяч событий в секунду. В докладе поделюсь болезненными уроками: как сделать Outbox под 100k+ событий/сек и как правильно оптимизировать WAL.

Вы узнаете конкретные техники оптимизации: от zero-copy публикации до асинхронного чтения с реплик. Разберем архитектурные решения для горизонтального масштабирования и построения observability, которые действительно помогут во время ночного инцидента.

И главное — обсудим честно, когда Outbox становится антипаттерном и пора переходить к другим решениям.

Team leader.

Видео

Другие доклады секции

Архитектура и масштабируемость