Мастер-класс «Удивительные эмбеддинги: как векторные представления применяются в задачах поиска и рекомендаций»

Нейронные сети и искусственный интеллект (data science)

Поисковые системы
Архитектурные паттерны
Критерии выбора технологий для проекта
Рекомендации / ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как устроена магия эмбеддингов внутри, мы подробно разбирать не будем, зато научимся махать волшебной палочкой! Здесь мы разберем на практике инструменты, которые позволяют строить и использовать векторные представления для рекомендательных и поисковых данных, даже если вы не data-scientist.

Целевая аудитория

Разработчики, интересующиеся современными решениями задач поиска и рекомендаций. ML-инженеры и архитекторы, работающие с векторными данными.

Тезисы

Эмбеддинги — это революционный инструмент, который уже сейчас трансформирует подходы к работе с информацией во множестве отраслей от поисковых систем и рекомендательных сервисов до бизнес-аналитики и маркетинга. Благодаря их уникальной способности представлять сложные данные, такие как тексты и изображения, в виде компактных числовых векторов, мы получаем новые возможности для автоматизации и оптимизации процессов, о которых раньше можно было только мечтать.

На нашем воркшопе вы не просто познакомитесь с различными видами эмбеддингов, но и научитесь применять их на практике для решения реальных задач. Мы подробно разберем:
* типы эмбеддингов: текстовые, визуальные и составные;
* операции с эмбеддингами: суммирование и кластеризация для анализа данных и выявления скрытых закономерностей;
* векторный поиск: пошагово создадим простой, но эффективный поисковый движок на основе базы Qdrant;
* рекомендательные системы: научимся строить систему персонализированных рекомендаций за 5 минут;
* файн-тюнинг эмбеддингов: обсудим, как донастроить эмбеддинги под ваши конкретные задачи, значительно повышая их точность и эффективность.

Главный вывод воркшопа: эмбеддинги — это мощнейший инструмент для структурирования, анализа и персонализации данных, открывающий принципиально новые горизонты в работе с информацией.

Сооснователь и CTO нескольких B2B SaaS в AdTech- (k50.ru) и CommerceTech- (searchbooster.io) областях.
Последние 2 года интересуется практической стороной применения больших языковых моделей в проекте wikilect.com.

Видео

Подготовительное задание
Подготовительное задание:
Для экономии времени и снижения рисков поломки интернета необходимо заранее скачать материалы по ссылке:
http://cdn.searchbooster.io/embeddings_workshop.zip
(файл будет размещен за 2 недели до даты проведения конференции)

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)