Построение инфраструктуры LLM с нуля на основе опыта Х5 Tech

BigData и инфраструктура машинного обучения (data engineering)

Python
Enterprise-системы
Безопасность инфраструктуры

Доклад принят в программу конференции

Мнение Программного комитета о докладе

С середины 2023 года команда AI X5 расширилась с 2 до 30 специалистов и реализовала несколько успешных проектов. Мичил поделится опытом разработки, сложностями и инструментами, уделяя внимание архитектуре LLM: инференс, логирование, мониторинг и интеграция для устойчивости к нагрузкам.

Целевая аудитория

Разработчики, менеджеры.

Тезисы

В мире, где большие языковые модели (LLM) становятся основой для автоматизации бизнес-процессов, важно понимать, как правильно интегрировать их в корпоративную инфраструктуру. В своем докладе я поделюсь опытом внедрения LLM в компании X5 Tech, начиная с простых вопросов: что такое LLM и как они могут изменить подход к решению задач.

Далее мы обсудим три ключевых бэкенда для инференса, которые обеспечивают различные уровни производительности и удобства, и покажем, как правильно выбрать подходящий инструмент в зависимости от имеющихся ресурсов и бизнес-целей. Я расскажу о том, как оптимизация инференса влияет на качество ответов и скорость реакции приложений, таких как чат-боты, и почему это критически важно для успешной работы.

На примере нашей инфраструктуры в X5 Tech я покажу, как мы организовали работу с LLM, включая использование специализированных решений для управления запросами и анализа производительности. Наконец, я поделюсь практическими рекомендациями по выбору и тестированию моделей, основанными на нашем опыте, чтобы помочь вам избежать распространенных ошибок и эффективно использовать LLM в вашем бизнесе.

Присоединяйтесь к моему выступлению, и вы узнаете, как можно быстро и эффективно внедрить LLM в вашу компанию, сокращая время и затраты на разработку, а также повышая качество обслуживания клиентов.

Team Lead.

X5 Tech

IT-компания и основной цифровой партнер торговых сетей и бизнесов X5 Group. Команда из более 3500 специалистов разрабатывает решения, которые помогают 325 тысячам сотрудников группы работать с максимальным технологическим комфортом, а миллионам покупателей быстро и удобно покупать свежие продукты.

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)