Роутинг и шардирование в PostgreSQL для случая MDM системы
Доклад отклонён
Целевая аудитория
Тезисы
В докладе мы рассмотрим способы построения кластера СУБД для MDM платформы Unidata и поговорим о различных стратегиях роутинга и шардирования.
При распределенном хранении данных таблицы как правило хранятся в горизонтально фрагментированном виде, эта операция называется шардингом. В процессе разработки балансировщика данных мы искали стратегию, при которой распределение записей по шардам будет наиболее равномерным, а изменение размера кластера потребует минимального переноса данных.
Второй рассмотренный вопрос касался роутинга. Под роутингом в данном контексте понимается процесс получения данных из хранилища. Различие схем роутинга заключается в том, где производить вычисление местонахождения данных и их агрегацию - внутри приложения или в хранилище.
Чтобы ответить на оба этих вопроса мы реализовали несколько альтернативных алгоритмов каждого типа и провели экспериментальное исследование.
Сотрудник Unidata Labs
Unidata