Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в «Wildberries»
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Как за год превратить сотни разрозненных CV-моделей в единый, масштабируемый пайплайн, который ежедневно обрабатывает 10+ млн карточек товаров (50+ млн изображений и 500K видео)? В докладе раскрою DS архитектуру системы модерации «Wildberries»: как мы унифицировали модели через TensorRT и DALI, перешли к шаблонной архитектуре «общий бэкбон - лёгкие головы» и построили ансамбль в Triton, чтобы снизить нагрузку и ускорить деплой. Расскажу, как автоматизировали ретроскоринг, прогнозируем нагрузку на модераторов и используем LLM для перепроверки. Это не просто кейс - это готовая инженерная система, которую можно масштабировать под любые задачи в сфере модерации.
Разрабатывает DL модели в сфере модерации контента в «Wildberries».
Ранее руководил Computer Vision-проектами для заводов ЕвроХим (видеоаналитика в промышленности).
Активно ведет open-source проекты на Github (Koldim2001) и снимает обучающие видеоролики по DS на своем YouTube канале.
Видео
Другие доклады секции
Data Engineering