Как VK распознаёт речь и можно ли обучить AI на небольшом объёме данных

Привет, друзья!

Весенне-летний сезон конференций закончился, и команда Онтико готовится к сентябрьским конференциям в Петербурге. 22 и 23 сентября состоится Saint HighLoad++ 2022. Билеты в продаже.

Забронировать билет на Saint HighLoad++ 2022

Сегодня продолжим знакомить вас со спикерами конференции и поделимся новой статьёй.


Доклады Saint HighLoad++ 2022

Для пассажира полёты — это поиск билетов, электронный check-In, «пристегните ремни» и паспортный контроль. Для программистов в авиакомпании — это полное техобслуживание самолетов раз в два года, проверки раз в два дня, штрафы в сотни тысяч долларов за задержку в десять минут. Здесь невозможно делать А/B-тесты и «быстро двигаться, ломая штуки». А бизнес хочет, чтобы ПО как можно точнее предсказывало время обслуживания самолета по совсем скромному количеству исторических данных.

Доклад Любови Рожковой из S7 TechLab о том, как специфика авиации и небольшое (по меркам HighLoad) количество данных заставляет программистов искать необычные подходы.

Пока все обучают AI на океанах размеченных данных, здесь используют «немодные» решающие деревья, которые можно обучить на выборке в сотни строк. 

Создают системы, которые объясняют инженерам оценки и позволяют им самим делать «очистку» данных. Многие из подходов команды S7 TechLab можно использовать не только в авиации, и Любовь готова это обсудить после доклада.

Виталий Шутов из VK расскажет, как устроена технология распознавания речи ВКонтакте изнутри. Чем распознавание коротких аудиосообщений отличается от работы с длинными видео.

Узнаем, что такое речевой домен и почему модель может работать намного хуже, чем должна, без видимых причин. Виталий покажет, какие модели пробовали, с какими трудностями столкнулись, как решали и что команда VK использует в итоге. Как разработчики борются с плохими расшифровками и что пришлось применить для матчинга текста с временной шкалой. И конечно поговорим о том, как можно использовать опыт VK, чтобы собрать технологию ASR под ваши задачи.


А после анонсов о докладах таких крутых менеджеров поговорим о том, как таких менеджеров искать и как самому найти компанию своей мечты.

Как тому самому инженеру и той самой компании найти друг друга?

Каждый из вас искал себе работу, или даже искал себе инженеров. И оказывалось, что это не так уж и просто. Надо знать, где искать, сколько денег предлагать и как торговаться.

Что делать с токсичными людьми? Как не бояться собеседования и что на нём говорить, а чего не стоит. Это касается и компании и претендента. При поиске работы все равны. А найти такую полезную информацию, а тем более от лица действующего HR-менеджера, не так уж и просто. Читаем новую статью в нашем блоге. Продолжение следует…

До скорого!