Улучшение качества сегментации на основе пост-процессинга ручной разметки, полученной с помощью Label Studio

Нейронные сети, искусственный интеллект

Machine Learning
Обработка данных

Доклад отклонён

Целевая аудитория

разработчики Computer Vision моделей и продуктовые менеджеры, отвечающие за качество продуктов, использующих сегментацию изображений

Тезисы

В рамках in-house решения задачи составления разметки нельзя быть полностью уверенным в получаемом качестве той самой разметки. Большую роль вы этом влияет простой человеческий фактор:
- желание побыстрее закончить с монотонной работой и начать обучать модель, если этим занимаются ML-разработчики,
- ограниченность временного ресурса, которая обусловлена необходимостью успеть выпуститься в production,
- простая невнимательность и неаккуратность.

В рамках доклада расскажу о том, как с помощью пост-процессинга на python (с использованием библиотеки Pillow) можно улучшить качество решения задачи сегментации, разметка для которой проведена с помощью Open Source платформы Label Studio.

Кандидат физико-математических наук, около 10 лет суммарного опыта работы и ведения научных проектов: занимался построением и развитием алгоритмов машинного обучения для решения прикладных задач в разных сферах (от E-commerce до экологии и EdTech’а), а также оцифровки бизнеса с последующим переходом на DDD-стратегию управления. В настоящее время CDO видеосервиса more.tv, ранее руководил департаментом обработки данных в Skillbox. Доцент факультета «Информационные технологии и прикладная математика» МАИ (НИУ).

more.tv

more.tv — это все, что ты смотришь и даже больше. Тебя ждет самый широкий выбор сериалов, фильмов и развлекательных шоу для всей семьи, весь контент главных российских телеканалов в одном месте и совершенно бесплатно. Начни просмотр дома на сайте или телевизоре и продолжи в дороге в мобильном приложении в любое время. Открывай каждый день more.

Видео