Централизованная платформа MLOps: от R&D до инференса в едином контуре

BigData и инфраструктура машинного обучения (data engineering)

Python
Machine Learning
ML

Доклад принят в программу конференции

Мнение Программного комитета о докладе

30 команд в крупной компании решают одновременно разные ML-задачи и у каждого свой зоопарк технологий, подходов. Конечно, хочется все унифицировать. Из доклада вы узнаете технические подробности того, как внедрялась и как эксплуатируется ML-платформа (Kubeflow).

Целевая аудитория

Data Scientists, ML Engineers, MLOps, DS/ML/AI Team Leads.

Тезисы

Доклад об опыте создания MLOps-платформы на 20+ команд. Расскажем, как выбирали стек, исходя из бизнес-задач и потребностей ML-разработчиков. Поделимся видением, почему для компании нашей структуры подошел в качестве основы платформы именно KubeFlow. Расскажем об этапах раскатки KubeFlow в Яндекс.Облаке и нюансах на каждом этапе. Честно поделимся опытом разработки шаблонов и обучений, деления GPU на команды, интеграции с Vault для хранения секретов и подготовки CI/CD на базе Jenkins и Artifactory.

Закончим на приятной ноте: что мы получили с точки зрения пользовательского опыта и бизнеса — сократили time-to-market выкатки моделей в прод в 1.5 раза при потреблении в 1.9 раза меньше ресурсов.

Елизавета Гаврилова

Лемана ПРО (Леруа Мерлен)

Senior ML Engineer в ЛеманаПро. Автор курса MLOps.Начало на Stepik. Преподаватель Факультета Компьютерных Наук ВШЭ. Председатель экзаменационной комиссии магистерской программы Искусственный интеллект. Научный руководитель.

Лемана ПРО (Леруа Мерлен)

Лемана ПРО (Леруа Мерлен) — лидер рынка DIY в России. Переосмысливают DIY-ретейл так же, как другие технологические лидеры до этого меняли банкинг и IТ-сервисы. В компании можно с нуля создавать диджитал-решения, примерять разные роли, использовать современные технологии, запускать новые продукты.

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)