Речевая аналитика на миллионах минут звонков в месяц
Доклад отклонён
Целевая аудитория
Тезисы
В нашей компании разрабатывается ряд продуктов, связанных с предоставлением услуг связи и ее организации. Рост бизнес-потребности в дополнительной аналитике звонков стимулировал начало разработки целого отдельного продукта под названием Речевая аналитика. Для его реализации потребовалось несколько лет работы трех отдельных команд, каждая из которых взяла на себя определенные обязательства по разработке решения для работы с входящим потоком звонков, их анализа и визуализации результатов. Корпоративные клиенты получают доступ к программному решению, функционал которого позволяет им проводить анализ аудио данных самостоятельно. На настоящий момент данный продукт обрабатывает миллионы минут аудиозаписей в месяц.
Команда анализа данных работала над моделями глубоких нейронных сетей, которые решают проблемы детектирования речевых данных в аудиосигнале (Voice activity detection) и перевода их в текстовый формат (Automatic Speech Recognition) с последующим подсчетом качественных и количественных метрик. Одним из вызовов перед командой была скорость обработки аудио данных: согласно требованиям к системе за 1 секунду необходимо обрабатывать не менее 200 секунд стерео файла. Пилотные наработки давали скорость 1 к 20, что не устраивало. В рамках доклада расскажем о том, как удалось выйти на нужные показатели: о пайплайне обработки аудиоданных, а также эксплуатации моделей машинного обучения, их дообучению и оптимизации. Особое внимание в докладе уделим технологиям и причинам, по которым их выбирали.
Более 6 лет занимаюсь разработкой решений в области машинного обучения и анализа данных. За плечами опыт завершенных проектов в направлениях CV, ASR, NLP и предиктивной аналитики на основе анализа временных рядов. TeamLead команды аудио и текста в Билайн Бизнес.
Билайн
Видео
Другие доклады секции
BigData и машинное обучение