HotCache на Tarantool: real-time пайплайн от Kafka до in-memory хранения с управляемым охлаждением данных

Архитектура и масштабируемость

Tarantool
Организация системы кеширования
Архитектурные паттерны

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Архитекторы, backend-инженеры, data-инженеры и техлиды, которые: строят real-time пайплайны работают с Kafka проектируют highload-сервисы используют in-memory БД решают задачи горячего/тёплого хранения

Тезисы

В системах с высокими требованиями к latency часто возникает необходимость отделить “горячие” данные от исторических. При этом пайплайн должен оставаться управляемым, масштабируемым и отказоустойчивым. Мы построили HotCache-платформу на базе Tarantool (TCS и TDB), где: ● данные поступают из Kafka; ● ● ● ● трансформируются в отдельном сервисе; сохраняются в in-memory хранилище; отдаются пользователям через REST API; управляются сценарии охлаждения данных. В докладе разберём: ● архитектуру пайплайна Kafka → Transformation Service → Tarantool (TCS/TDB) → ● ● ● ● ● ● REST; почему выбран in-memory подход и где он оправдан; разделение ответственности между сервисом трансформации и слоем хранения; организацию схем в Tarantool TCS и TDB; стратегии охлаждения данных: • TTL; • перенос в более “холодное” хранилище; • batch-архивация; • удаление по бизнес-политике; контроль производительности и latency; эксплуатационные аспекты: мониторинг, логирование, контроль back-pressure. Доклад — о практической архитектуре real-time слоя данных, который должен быть быстрым, но при этом управляемым.

Java-разработчик с более чем 15-летним опытом в создании масштабируемых и надёжных систем. Работал над проектами для крупнейших банков, инвестиционных компаний и глобальных брендов, включая Nike, AT&T и Vodafone. Специализируюсь на Spring Boot, микросервисной архитектуре, API-дизайне и облачных решениях (AWS, Azure).

Активно делится опытом: выступает на конференциях, менторит на хакатонах, пишет статьи и сейчас работает над книгой по алгоритмам и структурам данных на Java.

Видео

Другие доклады секции

Архитектура и масштабируемость