Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Data Engineering

Machine Learning

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Практический кейс архитектурной оптимизации CV/ML-пайплайна модерации изображений. В докладе вы узнаете, как небольшая команда смогла справиться со множеством задач маркетплейса благодаря хорошему дизайну системы и эффективным процессам.

Целевая аудитория

Data Scientists, MLOps-инженеры и разработчики ML-инфраструктуры.

Тезисы

Как за год превратить сотни разрозненных CV-моделей в единый масштабируемый пайплайн, который ежедневно обрабатывает 10+ млн карточек товаров (50+ млн изображений и 500K видео)? В докладе раскрою DS-архитектуру системы модерации Wildberries: как мы унифицировали модели через TensorRT и DALI, перешли к шаблонной архитектуре «общий бэкбон — легкие головы» и построили ансамбль в Triton, чтобы снизить нагрузку и ускорить деплой. Расскажу, как автоматизировали ретроскоринг, прогнозируем нагрузку на модераторов и используем LLM для перепроверки. Это не просто кейс — это готовая инженерная система, которую можно масштабировать под любые задачи в сфере модерации.

Дмитрий Колесников

Wildberries & Russ

Разрабатывает DL-модели в сфере модерации контента в Wildberries. Ранее руководил computer-vision-проектами для заводов ЕвроХим (видеоаналитика в промышленности).

Активно ведет Open-Source-проекты на GitHub (Koldim2001) и снимает обучающие видеоролики по DS на своем YouTube-канале.