Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Рецепт идеальной разметки в Computer Vision

BigData и машинное обучение

Распознавание речи, образов / Прикладное ML / Рекомендательные системы

Machine Learning

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Разметка данных становится новой нефтью 21-го века. Карина и Александр из Сбердевайсов расскажу про свой Open Source-фреймворк, который позволяет им собирать вместе данные, размеченные разными способами, и использовать эти данные для разных проектов.

Целевая аудитория

Data-инженеры, занимающиеся сбором и разметкой данных в области компьютерного зрения (CV); ML-инженеры, занимающиеся обучением моделей в CV; все, кому интересно разобраться, как получить качественную разметку CV-данных.

Тезисы

За последний год мы собрали, разметили и выложили в открытый доступ 3 больших датасета для различных задач компьютерного зрения (Computer Vision, CV): HaGRID, EasyPortrait и Slovo. Использование краудсорсинга платформ для разметки этих данных подвигло нас создать методы агрегации разметки, которые позволили добиться максимальной точности.

Решение обобщить эти методы на другие CV-задачи привело нас к созданию фреймворка агрегации, о котором и пойдет речь в докладе. Мы расскажем о:
* самых популярных способах разметки больших данных в CV: о краудсорсинге и нейронных сетях;
* необходимости агрегировать разметку на примере HaGRID, EasyPortrait и Slovo;
* мотивации создания фреймворка агрегации и о его реализации.

В конце продемонстрируем работу фреймворка для различных типов CV-разметки. Фреймворк доступен в Open Source, и мы планируем его поддерживать и обновлять, в том числе ориентируясь на пожелания комьюнити!

Computer Vision Engineer.

SberDevices

SberDevices — это компания полного цикла. Мы создаем идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаем инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.

Занимается исследованиями в области цифровой обработки сигналов, в частности обработки радиосигналов и изображений с 2012 года. В настоящий момент руководит исследовательскими командами в области компьютерного зрения в SberDevices. В прошлом ведущий инженер-железячник в области цифровой обработки на базе FPGA / ASIC.

SberDevices

SberDevices — это компания полного цикла. Мы создаем идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаем инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.

Видео

Другие доклады секции

BigData и машинное обучение