Эффективная модерация изображений: как исправлять нарушения, сохраняя количество и качество контента

Нейронные сети и искусственный интеллект (data science)

Machine Learning
ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Хотите узнать, как обрабатывать большой пул изображений и выявлять в них запрещенный контент с последующим исправлением? Приходите на доклад и узнаете, какой пайплайн построили в команде Авито.

Целевая аудитория

Разработчики машинного обучения, Data Scientists и специалисты, интересующиеся, как на Авито проходят модерацию и остаются опубликованными объявления с некритичными нарушениями.

Тезисы

В моем докладе:
1. влияние модерации на клиентский опыт: как стандартные подходы к модерации, такие как блокировка, ухудшают пользовательский опыт и почему скрытие нарушений на изображении может стать отличной альтернативой;
2. поговорим про блюр как инструмент модерации: эффективное применение блюра для маскировки нарушений на изображениях, или как мы сократили количество ручных проверок изображений в 10 раз;
3. восстановление изображений с помощью inpainting: как создать систему, которая удаляет нарушения с фотографий, сохраняя их исходный вид или даже улучшая. Обсудим применение передовых методов, таких как LaMa, LDM и SAM, и как эти SOTA-подходы в inpainting и сегментации могут быть использованы для повышения эффективности модерации;
4. результаты внедрения и оценка рисков: реальные примеры успеха и неудач, анализ возможных рисков.

Senior DS-инженер в команде автомодерации Авито, отвечает за сложные проекты, такие как автомодерация видео и автоматическое исправление нарушений.
Ex-Yandex, проводил ML-чемпионаты, внедрял CV на склад и NLP в телефоны.

Авито

На Авито каждый может найти что-то своё среди миллионов частных объявлений и предложений компаний. У них десятки тысяч RPS к бэкенду, терабайты картинок в хранилище и мощная система автоматизированной модерации на базе машинного обучения. Каждый месяц сервисом пользуется треть населения России.

Видео

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)