B-tree индекс в СУБД на основе PostgreSQL: в поисках "ближнего"...
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
B-tree индекс - самый важный и самый часто используемый вид индекса практически во всех базах данных под управлением СУБД PostgreSQL. В нем собранно колоссальное количество оптимизаций и подходов, позволяющих очень быстро найти нужную информацию, даже среди гигантского объема исходных данных.
Поиск бывает разный и продиктован разными бизнес-задачами. Нередко возникает задача, найти какой-то набор "ближайших" элементов по некоторому критерию. Например, ближайшие точки выдачи товара, ближайшие даты проведения какого-либо мероприятия и т.п. Не каждый такой запрос удается выполнить только с использованием B-tree индекса. Нередко требуется несколько запросов по одному индексу или по разным индексам, и даже по разным типам индексов. Однако, ряд запросов все же можно улучшить, если научить B-tree индекс стратегии (или алгоритму) поиска K-ближайших соседей (kNN = k-Nearest Neighbors).
В докладе мы в деталях расскажем, как устроен поиск по B-tree индексу в современных СУБД на основе PostgreSQL, что мы взяли за основу, и как, в конце концов, реализовали kNN стратегию поиска "ближнего".
Более 25 лет в IT. За это время приобрел опыт работы и инженера поддержки, и системного администратора, и разработчика, и руководителя группы разработки. Много лет занимался параллельным программированием, администрированием многопроцессорных вычислительных систем (50 узлов и более), управлением и разработкой баз данных с использованием PostgreSQL. Имею ряд научных публикаций и авторских свидетельств на ПО для ЭВМ. Последние 5 лет занимаюсь развитием форка на основе СУБД PostgreSQL.
Видео
Другие доклады секции
Базы данных и системы хранения