Обучение GigaChat MAX
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Осенью этого года мы запустили одну из самых сильных языковых моделей, говорящих на русском - GigaChat MAX
Эта модель - синтез самых современных технологий распределенного обучения и качественных данных.
Мы много работали над качеством обучения, его скоростью и стабильностью и хотим поделиться результатами: мы расскажем об оптимизациях NCCL, технологиях распредленного обучения и тренировке модели в пониженной точности
Руковожу разработкой LLM-претрейнов в команде GigaChat, а также читаю лекции в РЭШ по анализу данных
Видео
Другие доклады секции
Нейронные сети и искусственный интеллект (data science)