Что реально стоит за созданием собственной LLM?

GenAI и большие языковые модели (LLM)

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Как выглядит своя LLM на реальном продакшне — рассказывает Фёдор Минькин, руководитель GigaChat и базовых моделей Giga в Сбере. Разбор GigaChat 3.5 изнутри: данные, эксперименты, архитектурные решения и как удешевить обучение и инференс под highload‑нагрузки, с цифрами и прод-кейсами.

Целевая аудитория

Разработчики

Тезисы

Скачать презентацию

GigaChat это уникальная российская LLM, которую обучают, оптимизируют и масштабируют в продакшне. Голосовые ассистенты, управление роботами, мультимодальность — всё держится на одной текстовой модели.

Почему 90% команд отказываются строить свою LLM? Слишком дорого, слишком долго, слишком много неизвестных. Что реально стоит за этим решением — по деньгам, по инженерным ошибкам, по выбору архитектуры?

Как решали: Я расскажу о GigaChat 3.5 в стиле инженерного разбора: почему текстовая модель стала ядром для синтеза речи, мультимодальности и робототехники. Как оптимизировали датасеты претрейна, как сократили цикл экспериментов и как удешевили обучение и инференс под реальные highload-нагрузки. Плюс — конкретные продакшн-кейсы с метриками и деньгами.

Что заберёте с собой: — Стоимость обучения LLM: где уходят ресурсы и как это сократить — Оптимизация цикла исследований: от данных до экспериментов — Почему одна базовая текстовая модель выигрывает у зоопарка специализированных — Продакшн-кейсы и российской LLM

Федор Минькин

Сбер

Выпускник Московского физико-технического института

Старший управляющий директор-начальник управления базовых моделей Giga Департамента ИИ-платформы и моделей

Начинал карьеру с разработчика в компании Яндекс, c 2019 перешел в Сбер, где начал разработку речевых технологий и виртуальных ассистентов департамента SberDevices. С 2023 года лидирует разработку генеративной языковой модели GigaChat