AnalyticOps: конвейеры для поставки моделей машинного обучения в промышленную эксплуатацию DevOps и эксплуатация

Доклад принят в программу конференции
Антон Задорожный
Teradata

Архитектор и разработчик в области аналитических решений, построивший хранилища данных и аналитические решения (CRM, MDM), продолживший карьеру с data lake и потоковой аналитикой. В России работал с компаниями Сбербанк, ВТБ, МТС, Магнит, Мегафон, oneFactor.

Последние 3 года строит решения по обработке больших данных для мобильных операторов, финансовых институтов, автопроизводителей и фармацевтических компаний в Центральной Европе. Занимает позицию Principal Engineer в Teradata Global Delivery Center в Праге.

Тезисы

Data scientist'ы подготовили модель машинного обучения и показали хорошие результаты на тестовых данных. Если таких моделей единицы, то процесс тестирования можно проводить вручную, а что если моделей десятки/сотни/тысячи? Как и что автоматизировать, не мешая data science делать их работу? Как реализовать требования аудируемости моделей в регулируемых отраслях? Я отвечу на эти и другие вопросы, а также расскажу:
* как выглядит жизненный цикл модели машинного обучения;
* сколько шагов нужно в конвейере для проведения моделей от коммита до деплоймента;
* синергии и противоречия производственных процессов разработчиков ПО и data scientists;
* что, кроме кода, нужно версионировать, и зачем;
* как масштабировать эти процессы.

Непрерывное развертывание и деплой
,
Автоматизация тестирования
,
Machine Learning

Другие доклады секции DevOps и эксплуатация