Масштабная событийка на практике: пайплайны, ретраи, DLQ и неочевидные сложности

Архитектура и масштабируемость

Архитектурные паттерны

Рефакторинг

Масштабирование с нуля

Микросервисы

6 ноября, 13:30, Зал «Капсула 2»

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Реализация событийно-ориентированной архитектуры от Яндекс Go. Централизация, стандартизация, Push вместо Pull на выходе для упрощения интеграций. Эталонная реализация гарантированной доставки, работающая автоматом для всех потребителей.

Целевая аудитория

Разработчики, разработчики инфраструктуры, архитекторы, CTO.

Тезисы

Скачать презентацию Все презентации конференции

Событийная архитектура кажется простой: «прочитал → обработал → закоммитил». На пилоте все летает, переполнений «не было», стажер справится за неделю. Но как только мы идем в массовое внедрение — десятки команд, тысячи сервисов, — всплывают совсем другие задачи: пропускная способность, параметризация, наблюдаемость, гарантии, бесконечные ретраи, poisoned messages. В докладе я разберу три подхода к масштабированию событийки — от «каждый пишет сам» и «масштабируем лучшую библиотеку» до инверсии с push-моделью и общей «коммуналкой» — и покажу, как выглядит рабочее решение: прокси/пайплайны, коммунальные retry-queue, DLQ, circuit breaker'ы. Поделюсь метриками и граблями раскатки такого решения.

Алексей Терентьев

Яндекс Go

Руководит службой в Яндекс Go, в индустрии более 15 лет. Работал CTO в стартапах. Кандидат технических наук, стажировался в Harvard Medical School в Бостоне.

Видео

Другие доклады секции

Архитектура и масштабируемость

За гранью очередей: RabbitMQ 4 и его темная сторона stream'ов

Юрий Власов

CDEK

Архитектура современной антифрод-системы

Федор Васильев

xStack

Performance-driven Development: как сделать торговую систему с минимальными задержками

Алексей Шурыгин

AlphaNova

Как мы в Яндекс Еде за 3 месяца построили свой рекламный движок с нуля

Денис Токарев

Яндекс Еда

Сетевые нереплицируемые диски в облаке: почему, как, а главное — зачем?

Александр Руденко

K2 Cloud

Как мы ускоряли поиск в модели EAV для 13500 атрибутов через ClickHouse

Александр Залеский

МТС Web Services (MWS)

Эволюция Kafka as a Service: от факапа до чилаута

Анастасия Цепелева

РСХБ.цифра

RAG → GraphRAG → LightRAG: как мы трижды переписывали медицинский AI и кратно снизили издержки

Андрей Носов

Raft

Реалтайм-аналитика в распределенной системе

Вадим Зотеев

Яндекс Go

Enterprise Architecture on a Page: новый фреймворк для корпоративной архитектуры

Святослав Котусев

ВШЭ

Программный съем трафика на скорости 400 Gbps: опыт, оптимизации и неочевидные решения

Юрий Морозов

Группа компаний «Гарда»

Transaction Outbox под нагрузкой: как не потерять ни одного события при 100k+ RPS

Олег Мифле

Т-Банк

Интеллектуальное кеширование: можем ли мы научить backend предсказывать будущее

Николай Кокоулин

Ви.Tech

От одного контейнера до 4000 RPS: как мы масштабировали GitLab в трех дата-центрах

Максим Степанов

МТС Web Services (MWS)

Очереди на PostgreSQL: антипаттерн или реальность жизни?

Дмитрий Кривопальцев

Яндекс 360

Как масштабируются блокчейны

Сергей Прилуцкий

MixBytes

Как писать платежные интеграции на конечных автоматах и не умереть

Игорь Панасюк

Яндекс

От автоматизации к платформе: эволюция управления инфраструктурой в Sage

Роман Чернышев

Т-Банк

AppMetrica: миграция профилей на транзакционную запись в YDB для 500к событий в секунду

Павел Пересторонин

Яндекс

💻 Воркшоп: «Ломаем геораспределенный Postgres на базе Patroni»

Георгий Меликов

Exordos

Восстание машин, или Как хранилища Sage на новое железо заезжали

Руслан Боярский

T-Банк

OVN, техдолг и распределенка: переносим функции облачной сети в SDN из LXC

Владислав Одинцов

K2 Cloud

Планировщик рейта запросов

Михаил Апахов

Яндекс Еда

Подводные камни DLP-систем: архитектурный анализ

Евгений Аксенов

ГК Солар

От стартапа к highload-приложению — технические вызовы мобильного приложения «Пятерочка» на пути к 10k RPS и 25 млн пользователей

Алексей Юрченко

X5 Tech

Зеркала не врут: Traffic Mirroring в OVN

Александра Рукомойникова

K2 Cloud

Ревью архитектурных изменений без шума и пыли

Дмитрий Александров

Яндекс Лавка

Выжимаем облака досуха: как свое железо экономит 90% затрат на большие данные для стартапа

Андрей Ивахненко

Антиплагиат

DDoS на серверсайд: как мы выжили при x3-нагрузке с ограниченными ресурсами

Артем Букин

VK, VK Реклама

In-memory-поисковый движок вместо OpenSearch — система проверки SWIFT-платежей своими руками

Николай Кувыркин

Райффайзен Банк

Антипаттерн как фича: кросс-неймспейсный garbage collector в Kubernetes

Сергей Петров

РСХБ.цифра

Как поиск авиабилетов в Туту обрабатывает 10000 предложений в секунду: вызовы, архитектура, кейсы оптимизации

Иван Садовой

Туту

Эволюция архитектуры платежной системы: сохраняем SLA 99,99 при росте нагрузки в 30 раз

Иван Мареев

ЕДИНЫЙ ЦУПИС