Миллион товаров, опыт один: используем коллаборативные и мультимодальные эмбеддинги для кластеризации
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Расскажу о пути, который мы прошли, чтобы построить кластеризацию товаров на маркетплейсе, чтобы решить задачи составления тематических подборок для огромного числа товаров и улучшить пользовательский опыт.
Мы решили проблемы, связанные с каталогизацией, созданием тематических групп товаров, ускорили продвижение товаров, еще не проиндексированных рекомендательной системой, научились лучше понимать интересы пользователя.
Что еще будет в докладе?
- Почему мы пришли к задаче кластеризации и какие бизнес-требования перед нами стояли
- Наш вариант решения проблемы кластеризации в пространстве высокой размерности и поиска оптимальное число кластеров
- Поиск метрик, на базе которых оценивали качество получившийся кластеризации
- Обзор проблем, с которыми мы столкнулись, когда эксперимент оказался успешным и начали готовиться к проду, а также их решение.
Lead Data Scientist, Head of Horizontal ML в Wildberries
Сейчас отвечаю за разработку и исследования горизонтальном ML, которые помогают разным отделам в Wildberries в решении их задач.
Работал в области обработки естественного языка (NLP) и компьютерной лингвистики, работал с рекомендательными системами и трансформерными моделями для NLP задач, а также поведенческими моделями в маркетплейсах.
Преподавал в НИУ ВШЭ для специальности «Компьютерная и прикладная лингвистика» машинное обучение, а также глубокое обучение.
Видео
Другие доклады секции
Нейронные сети и искусственный интеллект (data science)