B-tree индекс в СУБД на основе PostgreSQL: в поисках "ближнего"...

Базы данных и системы хранения

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Разработчики и Администраторы СУБД и баз данных

Тезисы

B-tree индекс - самый важный и самый часто используемый вид индекса практически во всех базах данных под управлением СУБД PostgreSQL. В нем собранно колоссальное количество оптимизаций и подходов, позволяющих очень быстро найти нужную информацию, даже среди гигантского объема исходных данных. Поиск бывает разный и продиктован разными бизнес-задачами. Нередко возникает задача, найти какой-то набор "ближайших" элементов по некоторому критерию. Например, ближайшие точки выдачи товара, ближайшие даты проведения какого-либо мероприятия и т.п. Не каждый такой запрос удается выполнить только с использованием B-tree индекса. Нередко требуется несколько запросов по одному индексу или по разным индексам, и даже по разным типам индексов. Однако, ряд запросов все же можно улучшить, если научить B-tree индекс стратегии (или алгоритму) поиска K-ближайших соседей (kNN = k-Nearest Neighbors). В докладе мы в деталях расскажем, как устроен поиск по B-tree индексу в современных СУБД на основе PostgreSQL, что мы взяли за основу, и как, в конце концов, реализовали kNN стратегию поиска "ближнего".

Георгий Тарасов

ООО "Газинформсервис"

Более 25 лет в IT. За это время приобрел опыт работы и инженера поддержки, и системного администратора, и разработчика, и руководителя группы разработки. Много лет занимался параллельным программированием, администрированием многопроцессорных вычислительных систем (50 узлов и более), управлением и разработкой баз данных с использованием PostgreSQL. Имею ряд научных публикаций и авторских свидетельств на ПО для ЭВМ. Последние 5 лет занимаюсь развитием форка на основе СУБД PostgreSQL.