Генеративный ИИ для хранилищ данных: новый уровень автономности

Базы данных и системы хранения

PostgreSQL
Базы данных / другое
Machine Learning
Хранилища
Обработка данных

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

- Разработчики и системные аналитики данных, то есть все кто развивает хранилища данных; - ML Engineers и специалисты по GenAI; - Team Leads и технические руководители команд разработки хранилищ данных; - Руководители организаций - CTO, CDO (Chief Data Officer), Chief AI Officer, Руководители направлений Big Data / Data Platform

Тезисы

Современные корпоративные хранилища данных требуют всё большей скорости и прозрачности разработки: анализ legacy-кода, восстановление логики, документации, lineage и моделей данных занимают значимую долю рабочего времени команд. Генеративный ИИ впервые позволяет перенести значительную часть этих сложных инженерных задач на интеллектуальную систему. В докладе мы покажем, как применение GenAI меняет подходы к проектированию, разработке и сопровождению DWH, и какой уровень автономности реально достижим сегодня без потери управляемости и качества.

Мы расскажем, как использовали генеративный ИИ для решения практических задач: обратного реинжиниринга SQL-кода в корректные постановки задач, восстановления логической модели данных и data lineage в условиях отсутствия документации, а также «распутывания» противоречивых и сложных участков хранилища. Мы покажем, как после восстановления всех зависимостей мы добились значительно более точной и стабильной генерации SQL-кода. Кроме того, мы использовали GenAI для автоматизации нейминга по корпоративным naming-conventions, проверки корректности нейминга разработчиков и анализа влияния отдельных атрибутов на связанные сущности. Отдельный блок посвящён тому, как генеративный ИИ помогает выявлять неиспользуемый или никогда не запускаемый код, оценивать его потенциальное влияние и принимать решения о рефакторинге и очистке DWH. Реальные метрики пилотов показывают сокращение времени анализа legacy-кода до 70% и ускорение этапов разработки на 30–50%.

Доклад будет интересен тем, кто ищет практический инженерный опыт внедрения GenAI в Data Warehouse: от data-инженеров и архитекторов до CDO, CIO, Chief AI Officer и специалистов по AI-трансформации. Мы разберём архитектурные паттерны, типичные ошибки, ограничения и лучшие практики, а также покажем, как генеративный ИИ помогает перейти к новому уровню автономности работы с большими корпоративными данными.

Татьяна Сеземина

ИТ-холдинг Т1

* Директор портфеля проектов.
* Миграция хранилищ данных.
* Искусственный интеллект для хранилищ данных.
* Построение команд до 150 человек.

Видео