Векторный поиск в ClickHouse

Базы данных и системы хранения

Доклад принят в программу конференции

Тезисы

ClickHouse быстро выполняет все виды запросов, но его можно ускорить. Это касается работы с многомерными данными, которые могут возникать, например, при работе с текстами или картинками. Такие задачи часто встречаются в аналитике, и для них есть готовые решения. Особенно интересными являются индексы, такие как Faiss, HNSW и Annoy.

В этом докладе вы узнаете о новом виде индексов для ускорения запросов поиска похожих многомерных объектов. Я расскажу об их устройстве, тонкостях использования и о различиях между индексами на основе разных алгоритмов.

Более года занимается разработкой в ClickHouse. Заинтересован во многих темах, связанных с разработкой и машинным обучением.

Независимый разработчик ClickHouse.

Видео