GigaSearch - улучшаем точность фактологических ответов с помощью RAG.
Доклад отозван
Целевая аудитория
Тезисы
В докладе мы поговорим о том, как мы в SberDevices реализовали и раскатили на пользователей свою реализацию RAG (Retrieval Augmented Generation) на GigaChat - GigaSearch. Расскажем о том, что такое RAG в целом, заглянем под капот GigaSearch, обсудим трудности, с которыми нам пришлось столкнуться и как мы их победили, а также итоговый прирост по метрикам качества ответа на фактологические вопросы пользователей. На десерт поделимся успехом решения нетривиальной задачи: GigaChat генерировать не только верный фактологический ответ, но еще и ссылки на источники, которые были в нем использованы.
Закончил МФТИ ФОПФ.
Работал 6 лет разработчиком C++ в компаниях 3DLiga, Mentor Graphics и Megaputer. Занимался в числе прочего построением производительных алгоритмов для высоконагруженной системы обработки текстовой информации PolyAnalyst™️, тогда же начал заниматься NLP. Автор мобильных приложений: «Победи ЕГЭ 2015», «Цвета и фигуры для малышей», «Gimme Collage».
В компании Iponweb (AdTech) разрабатывал модели предсказания CTR, CVR. Работал с большими данными на кластерах Spark, Hadoop.
В Сбере создал с нуля центр компетенции по обработке документов в банке (NLP) — команду из 6 DS’ов. Автор DL-фреймворка для обработки документов — AutoNER. Сейчас фреймворком пользуются больше 10 DS-команд в Сбере и экосистеме банка.
С начала 2022 года работает в должности Lead Data Scientist в команде SmartNLP Sber. Devices. Команда SmartNLP разрабатывает «мозг» виртуального ассистента Салют. Значительно улучшил качество основной модели NER Салюта. Отвечает за ML-часть GigaSearch (RAG на GigaChat).
SberDevices
Видео
Другие доклады секции
Нейронные сети, искусственный интеллект