Построение высоконагруженного аналитического хранилища в ClickHouse от теории к практике: проблемы и решения
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Расскажу о разных этапах формирования высоконагруженного аналитического хранилища,
о том, какие ошибки важно не совершать (потому что они могут дорого стоить),
о плюсах и минусах использования различных инструментов внутри ClickHouse
• Определение структуры хранилища
o Как выбрать ключ распределения данных и почему это важно
o Насколько полезны специализированные движки таблиц в ClickHouse
o Как определить границу нормализации данных
• Оптимизация запросов
o Как локализовать вычисления отчетов и победить ограничения ClickHouse
o Как эффективнее объединять данных разных потоков
o Использование специальных типов данных
o Поиск баланса между вычислениями в памяти и предрасчётом на диске
• Изменение исторических данных в ClickHouse
• Ролевая модель доступа и разделение ресурсов между пользователями, аналитиками и тех. процессами
Ведущий системный архитектор
МТС Диджитал
Видео
Другие доклады секции
BigData и инфраструктура машинного обучения (data engineering)