Гибридный поиск на базе OpenSearch и Qdrant

Архитектура

Поисковые системы
ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Модный «векторный» поиск хорош, но теряет полнотекстовую составляющую, которая все еще важна. Спикер из Т-Банка расскажет, как они объединяли вместе два поиска: дообучали модель на датасете результатов, учитывали релевантность кликов, использовали дополнительную модель для ранжирования.

Целевая аудитория

Разработчики, архитекторы и менеджеры, разрабатывающие приложения, в которых нужен поиск.

Тезисы

Гибридный поиск — это сочетание классического полнотекстового поиска и векторного поиска. Я расскажу, как мы в Т-Банке внедряли гибридный поиск, какие проблемы пришлось решать и какой результат мы получили.

Наш поиск реализован на базе OpenSearch. Для улучшения полноты поиска мы реализовали отдельный сервис векторного поиска на базе векторной БД Qdrant. В докладе я затрону следующие темы: что такое векторный поиск, что такое векторные БД, какую проблемы мы хотим решить с помощью векторного поиска, как векторный поиск устроен у нас, как смешивать результаты полнотекстового и векторного поиска.

Руководитель отдела поисковых технологий в T-Банке.
Занимается улучшением поискового опыта для клиентов и сотрудников банка. Любит внедрять машинное обучение.
Ранее работал в Яндексе, ABBYY, был CTO в двух ML-стартапах.

Т-Банк

Команда Т-Банка — это разработчики, тестировщики, SRE-инженеры, архитекторы, аналитики, продакт-менеджеры, дизайнеры и другие специалисты. Вместе они создают финтех-продукты, которыми пользуются около 40 миллионов клиентов. Т-Банк развивает IT-индустрию, поддерживает комьюнити и делится экспертизой.

Видео

Другие доклады секции

Архитектура