Разработка высоконагруженных сервисов с моделями OpenAI
Доклад отклонён
Целевая аудитория
Тезисы
В докладе разберем как добиться максимальной производительности при работе с LLM и Voice To Text моделями OpenAI.
Разберем архитектуру решения реального продукта для анализа аудиозаписей и то, каким образом сервис обрабатывает десятки тысяч аудиозаписей на одном аккаунте Open AI и имеет возможность горизонтально масштабироваться.
Рассмотрим все ограничения Open AI сервисов, возникшие проблемы на пути становления сервиса и этапы изменения архитектуры.
Занимается разработкой 10 лет. Работал в компаниях Raft, Akvelon, Microsoft, Evernote на высоконагруженных проектах. Сейчас занимается AI-направлением в компании Raft на позиции CTO.
Raft
Видео
Другие доклады секции
Архитектуры и масштабируемость