Поиск в видеоконтенте при помощи AI

Нейронные сети и искусственный интеллект (data science)

Machine Learning
ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Когда-нибудь задумывались о том, как найти нужный кадр в тысячах видео? Приходите на доклад и узнаете, как работает мультимодальный сервис поиска нужных моментов среди большой базы видео.

Целевая аудитория

ML-инженеры.

Тезисы

В докладе я расскажу о том, какие фичи мы извлекаем, чтобы найти нужный кадр среди 40 тысяч видео. Что нужно сделать, чтоб векторная база при этом не распухла до ужасных размеров. О том, как заставить англоязычную мультимодальную модель понимать русский язык. Про борьбу с галлюцинациями Whisper и о том, как объединить результаты поиска по огромному массиву разнородных эмбеддингов.

Занимается машинным обучением в ООО «ГПМ Дата», специализируется на задачах MLOps и NLP. Кандидат технических наук.

ГПМ Дата

Лаборатория Gazprom ID по работе с данными, открывающая возможности цифровой трансформации компаниям. 130 специалистов в области данных и разработки ПО работают с лучшими и привлекают лучших.

Видео

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)