ML как платформа: от kubeflow до feature store
Привет, друзья!
Одна из секций предстоящего HighLoad++ 2024 — «ML как платформа: от kubeflow до feature store». Эксперты из Домклик и других ведущих компаний расскажут о своих подходах к созданию и развитию решений для работы с большими данными и ML-моделями. Разберёмся, как ускорить ML-процессы, стоит ли развивать собственную платформу или проще интегрировать имеющиеся решения в вашу инфраструктуру. Мы обсудим, как лидеры отрасли решают сложные задачи с помощью out-of-the-box-подхода и антихрупких решений. Поговорим о стандартизации обработки больших данных и тиражировании платформ для текстовых и голосовых ассистентов, компьютерного зрения, предиктивных и рекомендательных моделей.
Доклады и спикеры секции
Алина Баймашева, архитектор платформы Домклик, расскажет о создании собственной inhouse Feature Platform. Узнаем о подходах и этапах проектирования, о трудностях, с которыми сталкивалась компания, и как в результате изменился те
хнологический стек. Алина расскажет, что важно учитывать при создании Feature Platform и как построить MVP для конкретных бизнес-задач.
Нельзя просто так взять, и сделать Feature Store. Нужны исследования, совместимость, обучение. Коллега Алины, Евгений Дащенко, расскажет, как он и его команда последовательно внедряли Feature Store. Узнаем, как не уйти в долгострой и показать первые результаты в разумные сроки: начиная от разбора запросов и источников и заканчивая автогенерацией фич через sdk. Евгений поделится опытом адаптации Feature Store под бизнес-задачи и тем, как избежать типичных ошибок при его построении.
Олег Кабанов из Flocktory поделится опытом создания ML Feature Store с нуля: от использования стандартных хранилищ до адаптированного решения для Data Science-проектов. Он объяснит, почему готовые фреймворки, такие как Feast или Tecton, не подошли для Flocktory, и расскажет, как их команда повысила скорость обработки фич для ML-алгоритмов до одного дня. Олег опишет общее архитектурное решение, которое вы сможете адаптировать под свой стек.
Елизавета Гаврилова из Леруа Мерлен расскажет о создании централизованной MLOps-платформы, позволившей унифицировать процессы 30 команд. В докладе Елизавета затронет этапы развертывания KubeFlow, оптимизацию использования GPU, интеграцию с Vault и настройку CI/CD. Результаты впечатляют: компании удалось сократить time-to-market моделей и уменьшить потребление ресурсов почти в два раза.