Векторный поиск в ClickHouse

Базы данных и системы хранения

ClickHouse

#ClickHouse

Доклад принят в программу конференции

Целевая аудитория

Люди, которым интересны базы данных, ускорение запросов и анализ данных.

Тезисы

ClickHouse быстро выполняет все виды запросов, но его можно ускорить. Это касается работы с многомерными данными, которые могут возникать, например, при работе с текстами или картинками. Такие задачи часто встречаются в аналитике, и для них есть готовые решения. Особенно интересными являются индексы, такие как Faiss, HNSW и Annoy.

В этом докладе вы узнаете о новом виде индексов для ускорения запросов поиска похожих многомерных объектов. Я расскажу об их устройстве, тонкостях использования и о различиях между индексами на основе разных алгоритмов.

Более года занимается разработкой в ClickHouse. Заинтересован во многих темах, связанных с разработкой и машинным обучением.

Независимый разработчик ClickHouse.

Видео