От слов к данным: автоматизация аналитики с Text2SQL-системой в X5

GenAI и большие языковые модели (LLM)

ML

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

ML Инженеры, Аналитики, Продакт-менеджеры AI-решений

Тезисы

Как построить интеллектуальную систему генерации SQL-запросов для сотен пользователей, не владеющих SQL? В X5 мы прошли путь от создания первого прототипа до сложного LLM-пайплайна с интерактивными уточнениями, автоматическим роутингом между таблицами и шаблонизацией аналитических метрик.

В докладе:
- расскажем, как мы собирали и размечали данные для обучения и валидации,
- разберем систему метрик для оценки качества генерации SQL,
- сравним классический workflow pipeline с агентским подходом,
- покажем, как устроены наши Columns и Values Retriever’ы,
- обсудим архитектуру системы уточнений и шаблонизации запросов

И главное — честно обсудим: нужен ли вообще агент или базового RAG уже достаточно?

MLE в команде продуктивизации искусственного интеллекта X5 Tech. Студент магистратуры “AI Talent Hub” ИТМО. Выступаю на конференциях, занимаюсь спортом и люблю свое дело.

Видео