Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Рецепт идеальной разметки в Computer Vision

BigData и машинное обучение

Machine Learning

Доклад принят в программу конференции

Целевая аудитория

Data-инженеры, занимающиеся сбором и разметкой данных в области компьютерного зрения (CV); ML-инженеры, занимающиеся обучением моделей в CV; все, кому интересно разобраться, как получить качественную разметку CV данных.

Тезисы

За последний год мы собрали, разметили и выложили в открытый доступ 3 больших датасета для различных задач компьютерного зрения (Computer Vision, CV): HaGRID, EasyPortrait и Slovo. Использование краудсорсинг платформ для разметки этих данных сподвигло нас создать методы агрегации разметки, которые позволили добиться максимальной точности.

Решение обобщить эти методы на другие CV задачи привело нас к созданию фреймворка агрегации, о котором и пойдет речь в докладе. Мы расскажем о:
- самых популярных способах разметки больших данных в CV: о краудсорсинге и нейронных сетях
- необходимости агрегировать разметку на примере HaGRID, EasyPortrait и Slovo
- мотивации создания фреймворка агрегации и о его реализации

В конце продемонстрируем работу фреймворка для различных типов CV разметки. Фреймворк доступен в opensource и мы планируем его поддерживать и обновлять, в том числе ориентируясь на пожелания коммьюнити!

Computer Vision Engineer

SberDevices

SberDevices — IT-компания полного цикла в экосистеме Сбера, R&D-центр экспертизы в области искусственного интеллекта: речевые технологии, понимание естественного языка, компьютерное зрение, лицевая и голосовая биометрия. Производит умные устройства — от лампочек до телевизоров. В портфолио SberDevices — ruGPT-3, ruDall-E, RuSBERT и другие масштабные ML-проекты, высоконагруженные системы и технологии обработки Big Data.

Занимаюсь исследованиями в области цифровой обработки сигналов, в частности обработки радио-сигналов и изображений с 2012 года. В настоящий момент руковожу исследовательскими командами в области компьютерного зрения в SberDevices. В прошлом ведущий инженер-железячник в области цифровой обработки на базе FPGA / ASIC.

SberDevices

SberDevices — это компания полного цикла. Мы создаём идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаём инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.

Видео

Другие доклады секции

BigData и машинное обучение