Эволюция нейросетевого продакшена на примере синтезаа речи

Нейронные сети, искусственный интеллект

Доклад отклонён

Целевая аудитория

Этот доклад будет полезен всем, кто имеет дело с индустриальным машинным обучением, а также им сочувствующим. В особенности этот доклад будет полезен разработчикам, работающим с тяжеловесными нейросетями в проде. Также доклад будет интересен, представителям команд которые живут в хаосе невыстроенных MLOps процессов, так как во-многом доклад про переход от этого хаоса к порядку.

Тезисы

Синтез речи - технология, используемая в Тинькофф для различных голосовых роботов. Чтобы сделать быстрый, качественный синтез необходимы: 1) грамотно выстроенный бэкэнд 2) большая экспертиза в машинном обучении 3) правильно выстроенные процедуры.

За последний год команда синтеза речи проделала большой путь: нам удалось многократно ускорить работу сервиса, существенно улучшить его качество, повысить стабильность релизов, а также добиться автоматизации части наших процессов. В ходе доклада я расскажу про то, как мы этого достигли. Мой рассказ будет не только про технологии, но также про факапы и трудности, которые заставили нас их использовать.

Примеры тем, которые я освещу:

Переезд с tensorflow на pytorch в проде: как перестать есть кактус
Как делать релизы ML-сервиса, качество которого невозможно оценить без помощи человека?
Как порезать потребление сервисом ЦПУ в два раза?
Чем стоит руководствоваться при выборе между разными архитектурами нейронных сетей?

В результате доклада слушали получат представление о том, как функционируют сложные нейросетевые сервисы, а также я поделюсь с ними инсайтами относительно того, как улучшить разработку подобных систем.

Руковожу разработкой синтеза речи в Тинькофф

Тинькофф

Тинькофф

Видео