Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Построение высоконагруженного аналитического хранилища в ClickHouse от теории к практике: проблемы и решения

BigData и инфраструктура машинного обучения (data engineering)

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Инженеры данных, Архитекторы данных, Разработчики, Администраторы баз данных

Тезисы

Расскажу о разных этапах формирования высоконагруженного аналитического хранилища,
о том, какие ошибки важно не совершать (потому что они могут дорого стоить),
о плюсах и минусах использования различных инструментов внутри ClickHouse
• Определение структуры хранилища
o Как выбрать ключ распределения данных и почему это важно
o Насколько полезны специализированные движки таблиц в ClickHouse
o Как определить границу нормализации данных
• Оптимизация запросов
o Как локализовать вычисления отчетов и победить ограничения ClickHouse
o Как эффективнее объединять данных разных потоков
o Использование специальных типов данных
o Поиск баланса между вычислениями в памяти и предрасчётом на диске
• Изменение исторических данных в ClickHouse
• Ролевая модель доступа и разделение ресурсов между пользователями, аналитиками и тех. процессами

Павел Бронников

МТС Диджитал

Ведущий системный архитектор

МТС Диджитал

МТС — одна из ведущих экосистемных компаний России. Предоставляет услуги мобильной и фиксированной связи, решения в области объединенных коммуникаций, интернета вещей, обработки данных, облачных вычислений и кибербезопасности. Штат IT-специалистов компании превышает 8 000 человек.

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)