LLMOps в Альфа-Банке: вызовы и практические решения
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
В докладе на конкретном примере будет показано, как в enterprise‑среде организована платформа GenAI в Альфа‑Банке: от GPU‑кластера до инференса моделей. Будут разобраны: Архитектура GPU‑платформы и особенности кросс‑функционального кластера (on‑prem и облако, утилизация ресурсов). Подход к сокращению «зоопарка» моделей: критерии отбора, единый каталог и политика жизненного цикла моделей. Бенчмаркинг: методология расчета метрик, составление dataset, тестирование и выбор оптимальной конфигурации под продуктовые сценарии. Организация инференса: стек сервинга, маршрутизация запросов, observability и контроль стоимости токена.
TBD
Видео
Другие доклады секции
GenAI и большие языковые модели (LLM)