Мнение Программного комитета о докладе
Одним из ключевых вызовов VLM является точное распознавание сущностей на изображениях, особенно известных людей и объектов архитектуры. В докладе рассмотрены стратегии обучения, результаты экспериментов и предложен подход, повышающий качество идентификации при минимизации затрат на обучение.