HotCache на Tarantool: real-time пайплайн от Kafka до in-memory хранения с управляемым охлаждением данных
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
В системах с высокими требованиями к latency часто возникает необходимость отделить
“горячие” данные от исторических. При этом пайплайн должен оставаться управляемым,
масштабируемым и отказоустойчивым.
Мы построили HotCache-платформу на базе Tarantool (TCS и TDB), где:
●
данные поступают из Kafka;
●
●
●
●
трансформируются в отдельном сервисе;
сохраняются в in-memory хранилище;
отдаются пользователям через REST API;
управляются сценарии охлаждения данных.
В докладе разберём:
●
архитектуру пайплайна Kafka → Transformation Service → Tarantool (TCS/TDB) →
●
●
●
●
●
●
REST;
почему выбран in-memory подход и где он оправдан;
разделение ответственности между сервисом трансформации и слоем хранения;
организацию схем в Tarantool TCS и TDB;
стратегии охлаждения данных:
• TTL;
• перенос в более “холодное” хранилище;
• batch-архивация;
• удаление по бизнес-политике;
контроль производительности и latency;
эксплуатационные аспекты: мониторинг, логирование, контроль back-pressure.
Доклад — о практической архитектуре real-time слоя данных, который должен быть
быстрым, но при этом управляемым.
Java-разработчик с более чем 15-летним опытом в создании масштабируемых и надёжных систем. Работал над проектами для крупнейших банков, инвестиционных компаний и глобальных брендов, включая Nike, AT&T и Vodafone. Специализируюсь на Spring Boot, микросервисной архитектуре, API-дизайне и облачных решениях (AWS, Azure).
Активно делится опытом: выступает на конференциях, менторит на хакатонах, пишет статьи и сейчас работает над книгой по алгоритмам и структурам данных на Java.
Видео
Другие доклады секции
Архитектура и масштабируемость