Валерий Березовский

Сбер

В школьные годы занимался олимпиадным программированием. Окончил бакалавриат ФКН ВШЭ, сейчас обучаюсь в совместной магистратуре ФКН и ШАД. Уже два года работает в SberDevices в команде GigaChat, где занимается подготовкой данных для обучения LLM. Сейчас руководит командой из пяти человек — она разрабатывает пайплайны для дедупликации, фильтрации, очистки и парсинга текстов, строит инфраструктуру для замера метрик и генерации синтетических данных, а также проводит масштабные эксперименты для валидации гипотез.

Доклады

Как устроены данные GigaChat: петабайты текстов и триллионы токенов
GenAI и большие языковые модели (LLM)