Миллион товаров, опыт один: используем коллаборативные и мультимодальные эмбеддинги для кластеризации
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Расскажу о пути, который мы прошли, чтобы построить кластеризацию товаров на маркетплейсе для решения задач составления тематических подборок для огромного числа товаров и улучшения пользовательского опыта.
В итоге получилось решить проблемы, связанные с каталогизацией и созданием тематических групп товаров, ускорить продвижение товаров, еще не проиндексированных рекомендательной системой, научиться лучше понимать интересы пользователя.
Что еще будет в докладе?
* Почему пришли к задаче кластеризации и какие бизнес-требования перед нами стояли.
* Выбор подходящего варианта решения задачи кластеризации.
* Поиск метрик, на базе которых можно оценить качество получившейся кластеризации.
* Обзор проблем, связанных с подготовкой к проду, а также их решения.
Lead Data Scientist, Head of Horizontal ML в Wildberries.
Сейчас отвечает за разработку и исследования в горизонтальном ML, который помогает разным отделам в Wildberries в решении их задач.
Работал в области обработки естественного языка (NLP) и компьютерной лингвистики, работал с рекомендательными системами и трансформерными моделями для NLP-задач, а также поведенческими моделями в маркетплейсах.
Преподавал в НИУ ВШЭ для специальности «Компьютерная и прикладная лингвистика» машинное обучение, а также глубокое обучение.
Видео
Другие доклады секции
Нейронные сети и искусственный интеллект (data science)