Обучение GigaChat MAX

Нейронные сети и искусственный интеллект (data science)

Доклад принят в программу конференции

Целевая аудитория

ML/DL разработчики и инженеры

Тезисы

Осенью этого года мы запустили одну из самых сильных языковых моделей, говорящих на русском - GigaChat MAX
Эта модель - синтез самых современных технологий распределенного обучения и качественных данных.
Мы много работали над качеством обучения, его скоростью и стабильностью и хотим поделиться результатами: мы расскажем об оптимизациях NCCL, технологиях распредленного обучения и тренировке модели в пониженной точности

Руковожу разработкой LLM-претрейнов в команде GigaChat, а также читаю лекции в РЭШ по анализу данных

Видео

Другие доклады секции

Нейронные сети и искусственный интеллект (data science)