Миллион товаров, опыт один: используем коллаборативные и мультимодальные эмбеддинги для кластеризации

Нейронные сети и искусственный интеллект (data science)

Machine Learning

Доклад принят в программу конференции

Целевая аудитория

Data Scientists, Product Managers

Тезисы

Расскажу о пути, который мы прошли, чтобы построить кластеризацию товаров на маркетплейсе, чтобы решить задачи составления тематических подборок для огромного числа товаров и улучшить пользовательский опыт.
Мы решили проблемы, связанные с каталогизацией, созданием тематических групп товаров, ускорили продвижение товаров, еще не проиндексированных рекомендательной системой, научились лучше понимать интересы пользователя.
Что еще будет в докладе?
- Почему мы пришли к задаче кластеризации и какие бизнес-требования перед нами стояли
- Наш вариант решения проблемы кластеризации в пространстве высокой размерности и поиска оптимальное число кластеров
- Поиск метрик, на базе которых оценивали качество получившийся кластеризации
- Обзор проблем, с которыми мы столкнулись, когда эксперимент оказался успешным и начали готовиться к проду, а также их решение.

Lead Data Scientist, Head of Horizontal ML в Wildberries

Сейчас отвечаю за разработку и исследования горизонтальном ML, которые помогают разным отделам в Wildberries в решении их задач.
Работал в области обработки естественного языка (NLP) и компьютерной лингвистики, работал с рекомендательными системами и трансформерными моделями для NLP задач, а также поведенческими моделями в маркетплейсах.
Преподавал в НИУ ВШЭ для специальности «Компьютерная и прикладная лингвистика» машинное обучение, а также глубокое обучение.

Видео

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)