Feature store – автоматизация создания фичей для моделей на pyspark

Data Engineering

Фреймворки
Python
Архитектурные паттерны
Стандарты кодирования
Hadoop
Machine Learning
ETL

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Data-инженеры, ML-инженеры

Тезисы

Влад расскажет про решение по автоматизации подготовки данных для моделей, к которому пришли в команде скоринга, историю создания и проблемы других решений. Своя библиотека на pyspark позволяет задавать кастомные функции расчета с различными оптимизациями и помогла ускорить и стандартизировать разработку

CDO МТС Скоринг
Head of ML Ozon Bank
Head of ML Mokka
ML Team Lead Sber
ML Team Lead MTSBank

7 лет опыта управления командами данных
Занимался созданием и руководством команд машинного обучения, целью которых была разработка и внедрение моделей
Успешно спроектировал и запустил оффлайн и риалтайм системы машинного обучения, предназначенные для принятия решений

Видео

Другие доклады секции

Data Engineering