Wav2Vec2 - от большого к малому

Нейронные сети, искусственный интеллект

Доклад отклонён

Целевая аудитория

ML-инженеры и дата-саентисты, выпускающие модели машинного обучения в прод. Специалисты по голосовому распознаванию

Тезисы

1. Мы разработчик собственного движка распознавания речи в Билайн.
2. Базовая версия аналитики речи хорошо работала только с телефонными звонками.
3. Начали использовать сервис распознавания речи в различных условиях и столкнулись со снижением качества распознавания - для Билайн.Аудиобейджи потребовалось обрабатывать записи с микрофонов сделанные в сложных условиях. , где мы и посыпались... :.(
4. Расскажем про деплой SOTA модели распознавания речи в прод

Занимаюсь машинным обучением с 2017 года. С 2019 года разрабатываю движок голосового распознавания

билайн

билайн - оператор мобильной связи

Видео