Роутинг и шардирование в PostgreSQL для случая MDM системы

Базы данных и системы хранения

Доклад отклонён

Тезисы

В докладе мы рассмотрим способы построения кластера СУБД для MDM платформы Unidata и поговорим о различных стратегиях роутинга и шардирования.

При распределенном хранении данных таблицы как правило хранятся в горизонтально фрагментированном виде, эта операция называется шардингом. В процессе разработки балансировщика данных мы искали стратегию, при которой распределение записей по шардам будет наиболее равномерным, а изменение размера кластера потребует минимального переноса данных.

Второй рассмотренный вопрос касался роутинга. Под роутингом в данном контексте понимается процесс получения данных из хранилища. Различие схем роутинга заключается в том, где производить вычисление местонахождения данных и их агрегацию - внутри приложения или в хранилище.

Чтобы ответить на оба этих вопроса мы реализовали несколько альтернативных алгоритмов каждого типа и провели экспериментальное исследование.

Сотрудник Unidata Labs

Unidata

Unidata - разработчик MDM решений

Видео