RAG → GraphRAG → LightRAG: как мы трижды переписывали медицинский AI и кратно снизили издержки

Архитектура и масштабируемость

Python
Архитектурные паттерны
Оптимизация производительности
Методы и техника разработки ПО
Алгоритмы и их сравнение
Архитектуры / другое
Machine Learning
Оптимизация
ML
Базы знаний / wiki
СУЗ / системы управления знаниями
KCS / knowledge-centered service
Knowledge Ops
YDB

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Практическая история эволюции RAG-системы в MedTech через три итерации: от наивной реализации, дорогой GraphRAG к оптимальному LightRAG. С реальными цифрами, архитектурными решениями и ценой ошибок.

Целевая аудитория

Senior/Lead разработчики, архитекторы и ML-инженеры, которые создают или планируют создавать сложные системы на базе LLM. Доклад будет особенно полезен тем, кто работает в доменных областях с высокими требованиями к точности и связности данных (MedTech, FinTech, LegalTech) и ищет практические, готовые к продакшену архитектурные решения.

Тезисы

Когда внедряешь LLM в медицину, цена ошибки измеряется не только деньгами. Расскажу историю трех итераций одного проекта, которая поможет вам избежать наших граблей.

Три попытки, три архитектуры:
• RAG v1.0: Быстрый старт за неделю → провал в проде. Система не могла связать симптом из одного документа с протоколом лечения из другого
• GraphRAG: Качество ответов взлетело → бюджет тоже. $6-7 за индексацию одной карточки, тысячи долларов на весь корпус медицинских статей
• LightRAG: Оптимальный баланс. Сохранили преимущества графов, снизили затраты в 10 раз

Что разберем детально:
- Архитектура LightRAG: инкрементальная индексация, дедупликация сущностей, двухуровневый поиск
- Реальные расчеты стоимости для каждого подхода с конкретными цифрами
- Специфика MedTech: работа с регуляторами (HIPAA, GDPR), цитируемость источников
Сравнительная таблица: когда какой подход выбирать

Практическая ценность:
Готовый фреймворк выбора RAG-архитектуры + экономическое обоснование для защиты решения перед бизнесом.

NLP Lead
Архитектор ИИ
CTO

Видео

Другие доклады секции

Архитектура и масштабируемость