Поиск без права на ошибку: мультимодальный RAG для чертежей и ГОСТов на одной Н100
Доклад принят в программу конференции
Целевая аудитория
Тезисы
В инженерии классический RAG не работает: семантический поиск легко путает допуски («0.02» вместо «0.012» на чертеже), а модели не видят топологию изделия (Болт ➝ Насос ➝ Двигатель). В докладе я разберу архитектуру CosmoSphere — гибридную систему поиска в закрытом контуре. Вы узнаете: Ядро: Как мультимодальная Nemotron-3-Omni-30B (Mamba+MoE) нативно совмещает чтение ГОСТов и сложный OCR чертежей без внешней каскадной обработки. Память: Скрещивание графовой базы FalkorDB и Qdrant для «триангуляционного поиска» (подъем точности с 60% до 94%, галлюцинации <2%). Инференс: Как уложить мультимодальный конвейер, обход графа и LLM-ризонинг в 80GB VRAM с помощью TensorRT-LLM и Triton без падений по OOM. Чистота: Сборка SOTA-стека из компонентов, доступных для Enterprise-контура в 2026 году.
Chief AI-Architect (CAA), Raft
Руководитель школы архитекторов ОТУС
Руководитель направления GenAI b2b Softline
PhD Communication Science Tampere University (Finland)
Более 100 публикаций, из них 3 A+
3 патента, 2 Свидетельства ЭВМ по AI продуктам
Видео
Другие доклады секции
Архитектура и масштабируемость