Олег Конорев на HighLoad++ 2023

Речевая аналитика на миллионах минут звонков в месяц

BigData и машинное обучение

Обработка данных

Доклад отклонён

Целевая аудитория

Команды разработки голосовых ассистентов и сервисов обработки аудиоданных. Специалисты в области DS, DL и ML, разработчики сервисов под ML модели.

Тезисы

Все презентации конференции

В нашей компании разрабатывается ряд продуктов, связанных с предоставлением услуг связи и ее организации. Рост бизнес-потребности в дополнительной аналитике звонков стимулировал начало разработки целого отдельного продукта под названием Речевая аналитика. Для его реализации потребовалось несколько лет работы трех отдельных команд, каждая из которых взяла на себя определенные обязательства по разработке решения для работы с входящим потоком звонков, их анализа и визуализации результатов. Корпоративные клиенты получают доступ к программному решению, функционал которого позволяет им проводить анализ аудио данных самостоятельно. На настоящий момент данный продукт обрабатывает миллионы минут аудиозаписей в месяц.
Команда анализа данных работала над моделями глубоких нейронных сетей, которые решают проблемы детектирования речевых данных в аудиосигнале (Voice activity detection) и перевода их в текстовый формат (Automatic Speech Recognition) с последующим подсчетом качественных и количественных метрик. Одним из вызовов перед командой была скорость обработки аудио данных: согласно требованиям к системе за 1 секунду необходимо обрабатывать не менее 200 секунд стерео файла. Пилотные наработки давали скорость 1 к 20, что не устраивало. В рамках доклада расскажем о том, как удалось выйти на нужные показатели: о пайплайне обработки аудиоданных, а также эксплуатации моделей машинного обучения, их дообучению и оптимизации. Особое внимание в докладе уделим технологиям и причинам, по которым их выбирали.

Олег Конорев

Билайн

Более 6 лет занимаюсь разработкой решений в области машинного обучения и анализа данных. За плечами опыт завершенных проектов в направлениях CV, ASR, NLP и предиктивной аналитики на основе анализа временных рядов. TeamLead команды аудио и текста в Билайн Бизнес.

Билайн

В Билайн Бизнес создаем продукты на основе больших данных, их анализа и современных подходов в машинном обучении - удовлетворяем потребности корпоративных клиентов в передовых решениях.