Machine Learning для синтеза и распознавания речи

Привет, друзья!

Вот и осень. А это значит, чуть больше, чем через 3 недели, мы встретимся на Saint HighLoad++ 2022. Во-первых, это красиво — гулять по осеннему Петербургу. Во-вторых — вряд ли где-то ещё в Петербурге вы найдёте столько знаний о высоконагруженных системах. Присоединяйтесь!

Забронировать билет на Saint Highload++ 2022

Мы уже живём в будущем — нейронные сети рисуют картины, учатся понимать и разговаривать. На Saint HighLoad++ мы поговорим об одной из областей применения Machine Learning — о синтезе и распознавании речи. Исключительно с практической точки зрения от тех, кто это уже делает.

Доклады о Machine Learning для синтеза и распознавания речи

В секции три доклада. В докладе «Распознавание речи для субтитров в VK Видео» Виталий Шутов расскажет о том, как внутри устроена технология распознавания речи ВКонтакте. Чем распознавание коротких аудиосообщений отличается от распознавания длинных видео? Что такое речевой домен, какие модели пробовали VK видео. И в целом — как можно использовать опыт VK, чтобы собрать технологию ASR под свои задачи.

Павел Алексеев

Второй доклад — от Павла Алексеева «Эксплуатация голоса в Марусе. С какими проблемами мы столкнулись и при чем тут GPU». Маруся работает на 200 серверах, в которые инсталлировано более тысячи видеокарт. Как ребята используют их?

Maria Skorik

Третий доклад — от Андрея Чернопятова (SberDevices) про «Нагрузочное тестирование синтеза и распознавания речи в SberDevices». Как тестировать звуковые сервисы? Какие метрики применимы? Что такое «быстрый, но качественный ASR/TTS»? Как подружить скорость и стабильность?


Email-курс для тех, кто только входит в тему высоких нагрузок

Если ваш проект совсем недавно стал высоконагруженным, и вы уже хватаетесь за голову — как масштабироваться дальше, как поддерживать отказоустойчивость — рекомендуем подписаться на курс лекций HighLoad++ Junior. 30 простых и логичных лекций от топовых разработчиков помогут вам понять базовые основы разработки highload-систем. Вы пройдете все этапы от самых общих вещей проектирования до понимания деталей разработки крупных систем и начнёте думать как разработчик высоконагруженных проектов. В итоге ваша стоимость на рынке труда возрастёт минимум на 20%.

Поговорим вот о чём:

• Логика проектирования и архитектура крупных проектов.
• Проблемы нагрузки на базу данных.
• Масштабирование базы данных через шардирование и партиционирование.
• Кеширование, NoSQL, очереди.
• Поиск, Hadoop и бинарные хранилища.

Если вы и так уже всё понимаете про высокие нагрузки, перешлите это письмо менее опытным коллегам. Уверены, ваша команда заработает гораздо эффективнее, если каждый будет понимать основные принципы создания крупных проектов.


Подписаться на курс HighLoad++ Junior

На сегодня всё! До встречи!