DeepSeek и Qwen в enterprise-контуре: строим надежный AI Flow для классификации чувствительных данных

Архитектура и масштабируемость

Защита информации
Архитектурные паттерны
Архитектура данных, потоки данных, версионирование
Безопасность
Типовые ошибки
Методологии

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Маст-хэв для всех, кто внедряет ИИ в enterprise. Спикер без хайпа показывает, как приручить локальные LLM (DeepSeek, Qwen) в закрытом контуре для решения задач Data Governance. Никакой «магии» — только строгая инженерия, детерминированные AI Flow и готовые паттерны для разметки данных.

Целевая аудитория

Архитекторы данных, CDO, Data Lead, Data Steward, DPO, ISO и все кто участвует в процессах Data Governance.

Тезисы

Внедрение LLM в корпоративные процессы управления данными (Data Governance) часто превращается в хаос: непредсказуемые ответы, галлюцинации моделей и невозможность выпустить такое решение в прод из-за жестких требований ИБ.

Мы прошли путь от ручной разметки метаданных до создания архитектуры AI Flow, которая превращает вероятностную природу нейросетей в предсказуемый и надежный конвейер обогащения каталога данных.

В докладе я расскажу:

  • Про "3 уровня прожарки данных" (Rare, Medium, Well-Done) и почему без уровня Rare корпоративный обмен данными невозможен.

  • Как мы ушли от ненадежных автономных чат-агентов («Agentic AI») к детерминированным пайплайнам (AI Flow) со строгими контрактами на стыках.

  • Как "научить" локальные модели (Qwen, DeepSeek) решать задачи Data Governance, и сравним их с облачной Gemini.

  • Почему без глубокого промпт-инжиниринга локальные LLM проваливают задачи ИБ, и какие техники реально работают.

  • Разберем архитектуру системы автоматической классификации чувствительных данных на базе событий (Event-driven) из каталога OpenMetadata.

Дмитриев Игорь

Независимый эксперт

Архитектор платформы данных с 10+ годами опыта работы с Big Data. Специализируюсь на выстраивании взаимодействия между продуктовыми командами и платформой, проектировании отказоустойчивых дата-пайплайнов и развитии систем Data Governance. Успешно внедряю AI-решения для автоматизации как Data Governance, так и других процессов работы с данными.

Видео