Мастер-класс: «Удивительные эмбеддинги — как векторные представления применяются в задачах поиска и рекомендаций»

Нейронные сети и искусственный интеллект (data science)

Поисковые системы
Архитектурные паттерны
Критерии выбора технологий для проекта
Рекомендации / ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как устроена магия эмбеддингов внутри, мы подробно разбирать не будем, зато научимся махать волшебной палочкой! Здесь мы разберём на практике инструменты, которые позволяют строить и использовать векторные представления для рекомендательных и поисковых данных, даже если вы не data-scientist.

Целевая аудитория

Разработчики, интересующиеся современными решениями задач поиска и рекомендаций. ML-инженеры и архитекторы, работающие с векторными данными

Тезисы

В настоящее время эмбеддинги становятся все более востребованным инструментом в различных отраслях — от поисковых систем до рекомендательных сервисов и аналитики данных. Их способность представлять сложные данные, такие как текст, изображения или аудио, в виде компактных числовых векторов открывает новые горизонты для автоматизации и оптимизации процессов.

Эмбеддинги позволяют не только улучшить качество поиска и персонализации, но и решать задачи, которые раньше казались слишком сложными: от анализа неструктурированных данных до одновременной работы с различными типами контента.

На воркшопе мы рассмотрим различные виды эмбеддингов и применим их для построения векторного поиска и простой системы рекомендаций.

Классификация эмбеддингов(Текстовые, Звуковые, Изображения, Составные эмбеддинги)

Операции с эмбеддингами:
Суммирование и кластеризация для выявления групп и схожести данных.

Эмбеддинге в поиске:
Делаем векторный поиск на коленке на базе Qdrant

Рекомендательные системы:
Векторная рекомендательная система за 5 минут

Основной посыл:
Эмбеддинги — мощный инструмент для структурирования и анализа данных, который трансформирует подход к поиску, рекомендациям и обработке информации.

Сооснователь и CTO нескольких B2B SaaS в AdTech- (k50.ru) и CommerceTech- (searchbooster.io) областях.
Последние 2 года интересуется практической стороной применения больших языковых моделей в проекте wikilect.com.

searchbooster.io

В Wikilect.com используют AI для решения задач среднего и крупного бизнеса.

Видео