Умные алгоритмы обработки строк в ClickHouse Базы данных и системы хранения
Доклад принят в программу конференции
Данила Кутенин
Яндекс
Разработчик базового поиска в Яндексе — инфраструктрура, подготовка индекса и работоспособность более 5000 поисков среди нескольких дата-центров.
Попутно делает проекты в ClickHouse.
danlark@yandex-team.ru
Тезисы
Мы расскажем о самом эффективном алгоритме поиска подстроки или одновременно нескольких подстрок, о котором вы услышите впервые и который был внедрён в ClickHouse. Мы покажем, какие трюки использованы для поиска регулярных выражений, как поискать сразу по многим регулярным выражениям, как эффективно обрабатывать UTF-8 строки. Также углубимся в тему о том, как найти похожие строки и какие трудности возникают в определении "похожести".
Другие доклады секции Базы данных и системы хранения
Не очень большие данные
Павел Лузанов
Постгрес Профессиональный
Рутина администратора баз данных
Андрей Сальников
Data Egret
Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL
Иван Муратов
Первая Мониторинговая Компания
Контейнерные базы Oracle (CDB/PDB) и их практическое использование для разработки ПО
Александр Толоконников
Спортмастер
Shardman - постгрес для кластеров. Что есть сейчас, что будет завтра
Андрей Лепихов
Postgres Professional