Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Миллионы часов: поиск копий в VK Видео

Архитектура

Доклад принят в программу конференции

Мнение Программного комитета о докладе

В докладе рассказывается о решении задачи поиска дубликатов видео при загрузке на ВК. Рассказ охватывает несколько стадий этой задачи: декодирование видео, оптимальный сбор фингерпринтов, поиск аналогов. В чем отличие от распознавания лиц, какие сложности при работе с видео - всё в этом докладе.

Целевая аудитория

Доклад будет интересен людям, решающим проблему нечеткого поиска по видеоконтенту. А также всем, кому интересно, как VK Видео устроен под капотом.

Тезисы

Каждый год на платформе VK Видео появляются сотни миллионов единиц уникального контента: видео от известных блогеров, музыкальные клипы, фильмы и сериалы. Мы хотим защищать такой контент и его авторов от копирования. В докладе расскажем, как мы это сделали в условиях такой нагрузки и крайне высокой цены ошибки.

Мы вместе пройдем путь эволюции системы, позволяющей находить копии видеоконтента: от прототипа до production-ready решения, использующего Java/C++, низкоуровневую работу с ffmpeg, нейросети (libtorch), FAISS с IVF-индексами на GPU. Рассмотрим ключевые проблемы, с которыми мы столкнулись: многопоточное декодирование видео и снятие отпечатков, размеры и масштабирование индексов, квантизация, повышение точности работы алгоритма матчинга.

Никита Кочетков

ВКонтакте

Старший разработчик в команде VK Видео. Активно участвовал в создании рекомендательной системы VK Клипов и Видео. Ранее работал в JetBrains над созданием платформы по статическому анализу - Qodana.

ВКонтакте

ВКонтакте — крупнейшая социальная сеть в России. Команда ВКонтакте разрабатывает технологические решения, которые отвечают критериям быстродействия, отказоустойчивости и качества, чтобы пользователи получали максимум для общения, работы, учёбы, развлечения и творчества.

Видео

Другие доклады секции

Архитектура