Авторы в Дзене и как мы ищем их аудиторию

BigData и машинное обучение

ML

Доклад принят в программу конференции

Целевая аудитория

Люди, которые занимаются разработкой рекомендательных систем, а особенно те, кто имеют дело с рекомендательными системами на маркетплейсах.

Тезисы

Дзен — это площадка, где пользователь находит контент для себя, а авторы — свою аудиторию. Наша задача — с помощью механизмов рекомендаций облегчить поиск аудитории для креатора.

На первый взгляд, задача очень похожа на задачу рекомендаций холодного контента, однако на практике она оказывается на порядок сложнее.

Если в «холодном старте» контента можно использовать статистики взаимодействия автора с пользователями и реакции подписчиков, которые первые видят айтем, то в нашей задаче такой коллаборативной информации нет. Стандартные контентные похожести айтемов использовать «из коробки» тоже не получится.

Ещё одно отличие состоит в том, что пользователю недостаточно одной встречи с контентом автора, чтобы принять решение о подписке, а значит и собирать фидбэк надо дольше и аккуратнее.

Дополнительная сложность возникает, когда новый автор выпускает узкопрофильный контент, непохожий на то, что любит core-аудитория сервиса.

В докладе я расскажу, как мы сталкивались со всеми этими проблемами и решали их: как научились определять похожести авторов и автоматически подбирать для них подходящую аудиторию.

Закончила МФТИ и ШАД, два года работает в службе ранжирования Дзена. За время работы успела потрогать разные части рекомендательной системы: учила основную модель, разрабатывала новые механизмы набора кандидатов, «лечила» проблему «холодного старта» айтемов.

VK, Дзен

Дзен — это контентная платформа, ленту рекомендаций которой ежедневно используют более 20 млн пользователей. Отталкиваясь от интересов каждого пользователя, Дзен собирает ленту из статей, видео, коротких видео и постов.

Видео

Другие доклады секции

BigData и машинное обучение