Валерий Березовский
Сбер
В школьные годы занимался олимпиадным программированием. Закончил бакалавриат ФКН ВШЭ, сейчас обучаюсь в совместной магистратуре ФКН и ШАД. Уже два года работаю в SberDevices в команде GigaChat, где занимаюсь подготовкой данных для обучения LLM. Сейчас руковожу командой из пяти человек — мы разрабатываем пайплайны для дедупликации, фильтрации, очистки и парсинга текстов, строим инфраструктуру для замера метрик и генерации синтетических данных, а также проводим масштабные эксперименты для валидации гипотез.
Доклады
Инженерия данных в эпоху LLM: опыт построения датасетов с триллионами токенов.
HighLoad++ 2025
GenAI и большие языковые модели (LLM)