Во всех организациях огромный объем передаваемых данных — это логи и метрики бегущих микросервисов. В Яндексе через YDB Topics каждую секунду пишется около 80 ГБ логов.
Как разработчик YDB Topics, я расскажу:
* как в Яндексе устроен процесс обработки такого огромного объема логов;
* что такое erasure кодирование и почему оно экономит половину места по сравнению с Kafka;
* что такое федерации из кластеров брокеров сообщений: как в них писать и читать, что произойдет при отказах. На примере Kafka и YDB Topics;
* какие недостатки у федерации из кластеров и в каких случаях она не подойдет;
* как воспроизвести такой экономичный способ сбора логов на open-source-технологиях и что нужно учесть, чтобы сделать из этого решения платформу.