Кто это? Что это? Рецепт обучения VLM для запоминания именованных сущностей.

Data Engineering

ML

Доклад принят в программу конференции

Целевая аудитория

Все, кто увлекается GenAI, в частности VLM и мультимодальными моделями.

Тезисы

Стандартные подходы к обучению VLM далеко не всегда позволяют моделям достоверно запоминать именованные сущности.
В нашем докладе расскажем о том, какие эксперименты мы провели, чтобы научить VLM лучше распознавать достопримечательности, картины и лица, а также поделимся подобранным рецептом обучения, который позволяет значительно улучшить качество итоговой модели.

5 лет в ML.
Начинал с обучения чат-бот системы для банка ВТБ и цифрового помощника "VK Assistant".
Сейчас - Senior ML-engineer в SberDevices. Занимается обучением VLM.
Выпускник МАИ. Аспирант.

Видео

Другие доклады секции

Data Engineering