Миллион товаров, опыт один: используем коллаборативные и мультимодальные эмбеддинги для кластеризации

Нейронные сети и искусственный интеллект (data science)

Machine Learning
Рекомендации / ML
ML

Доклад принят в программу конференции

Целевая аудитория

Data Scientists, Product Managers.

Тезисы

Расскажу о пути, который мы прошли, чтобы построить кластеризацию товаров на маркетплейсе для решения задач составления тематических подборок для огромного числа товаров и улучшения пользовательского опыта.

В итоге получилось решить проблемы, связанные с каталогизацией и созданием тематических групп товаров, ускорить продвижение товаров, еще не проиндексированных рекомендательной системой, научиться лучше понимать интересы пользователя.

Что еще будет в докладе?
* Почему пришли к задаче кластеризации и какие бизнес-требования перед нами стояли.
* Выбор подходящего варианта решения задачи кластеризации.
* Поиск метрик, на базе которых можно оценить качество получившейся кластеризации.
* Обзор проблем, связанных с подготовкой к проду, а также их решения.

Lead Data Scientist, Head of Horizontal ML в Wildberries.

Сейчас отвечает за разработку и исследования в горизонтальном ML, который помогает разным отделам в Wildberries в решении их задач.
Работал в области обработки естественного языка (NLP) и компьютерной лингвистики, работал с рекомендательными системами и трансформерными моделями для NLP-задач, а также поведенческими моделями в маркетплейсах.
Преподавал в НИУ ВШЭ для специальности «Компьютерная и прикладная лингвистика» машинное обучение, а также глубокое обучение.

Видео

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)