Рецепт идеальной разметки в Computer Vision
Доклад принят в программу конференции
Целевая аудитория
Тезисы
За последний год мы собрали, разметили и выложили в открытый доступ 3 больших датасета для различных задач компьютерного зрения (Computer Vision, CV): HaGRID, EasyPortrait и Slovo. Использование краудсорсинг платформ для разметки этих данных сподвигло нас создать методы агрегации разметки, которые позволили добиться максимальной точности.
Решение обобщить эти методы на другие CV задачи привело нас к созданию фреймворка агрегации, о котором и пойдет речь в докладе. Мы расскажем о:
- самых популярных способах разметки больших данных в CV: о краудсорсинге и нейронных сетях
- необходимости агрегировать разметку на примере HaGRID, EasyPortrait и Slovo
- мотивации создания фреймворка агрегации и о его реализации
В конце продемонстрируем работу фреймворка для различных типов CV разметки. Фреймворк доступен в opensource и мы планируем его поддерживать и обновлять, в том числе ориентируясь на пожелания коммьюнити!
Computer Vision Engineer
SberDevices
Занимаюсь исследованиями в области цифровой обработки сигналов, в частности обработки радио-сигналов и изображений с 2012 года. В настоящий момент руковожу исследовательскими командами в области компьютерного зрения в SberDevices. В прошлом ведущий инженер-железячник в области цифровой обработки на базе FPGA / ASIC.
SberDevices
Видео
Другие доклады секции
BigData и машинное обучение