Искусственный vs естественный интеллект в задачах разметки
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Пройдемся по следующим темам:
* разметка в эпоху до LLM и сильных SOTA-решений;
* практические кейсы в домене CV: SAM для задач детекции и сегментации, VLM для кепшенинга изображений и видео;
* практические кейсы в домене NLP: SOTA-решения в задаче описания, суммаризации, рерайтинга больших пластов текста;
* практические кейсы в домене звука: транскрибация аудио, озвучка в режиме сингл- и мультиспикер. Кросс-модальная разметка для задач видео и аудио;
* появление LLM на арене: ускорение разметки, синергия человека и нейросетей;
* специализированная разметка: когда нейронные сети не справляются;
* синтетические данные и как очистить авгиевы конюшни;
* что делать, когда кончится Интернет?
Руководит исследовательскими ML-командами в SberDevices. В прошлом инженер-железячник в области цифровой обработки сигналов на FPGA и ASIC, в частности, для обработки изображений и звука. Автор топовых лекций по обработке сигналов и регулярный спикер на научно-технических конференциях. Активный контрибьютор в Open Source.
SberDevices
Помогает Сберу делать его флагманский ИИ лучше: делают инструменты для DS-/ML-команд, позволяющие быстро и максимально качественно размечать данные практически любой сложности.
Сбер / абт
Закончил кафедру ИУ7 МГТУ им. Баумана.
Был разработчиком ПО в Институте общей и неорганической химии им. Курнакова, РНЦ Курчатовский Институт, в Российско-Корейском Центре исследования энергии.
Автор системы по учету и контролю сварных соединений нефте- и газопроводов.
Руководил компанией по разработке высоконагруженных проектов Netstream, плодами которой были проекты, связанные с online-вещанием и видео (smotri.com, ivi). В 2012 году Netstream вместе со всей командой был дружественно поглощен одним из своих заказчиков — ivi. C 2012 года по сей день Евгений работает CTO ivi.
C 2006 г. преподает в МГТУ им. Баумана авторский курс «Технологии командной разработки ПО».
Является автором магистерской программы МАИ по подготовке менеджеров в IT.
ИВИ
.
Ozon
Автор LLM-бенчмарка llmarena.ru. Преподаватель краудсорсинга в ШАДе, ВШЭ, МФТИ. Ex-Founder & ex-CTO TrainingData.ru.
llmarena.ru
Руководитель службы разметки данных в Yandex Crowd. Прошёл долгий путь от Crowd Solutions Architect до руководства службы, которая помогает всему Яндексу обучать ML и нейросети.
Яндекс Крауд
Видео
Другие доклады секции
Нейронные сети и искусственный интеллект (data science)