Внедрение LLM в корпоративные процессы управления данными (Data Governance) часто превращается в хаос: непредсказуемые ответы, галлюцинации моделей и невозможность выпустить такое решение в прод из-за жестких требований ИБ.
Мы прошли путь от ручной разметки метаданных до создания архитектуры AI Flow, которая превращает вероятностную природу нейросетей в предсказуемый и надежный конвейер обогащения каталога данных.
В докладе я расскажу:
Про "3 уровня прожарки данных" (Rare, Medium, Well-Done) и почему без уровня Rare корпоративный обмен данными невозможен.
Как мы ушли от ненадежных автономных чат-агентов («Agentic AI») к детерминированным пайплайнам (AI Flow) со строгими контрактами на стыках.
Как "научить" локальные модели (Qwen, DeepSeek) решать задачи Data Governance, и сравним их с облачной Gemini.
Почему без глубокого промпт-инжиниринга локальные LLM проваливают задачи ИБ, и какие техники реально работают.
Разберем архитектуру системы автоматической классификации чувствительных данных на базе событий (Event-driven) из каталога OpenMetadata.