Prod, do stack: production-ready-решения через data science-конкурсыBigData и машинное обучение

Доклад принят в программу конференции

Dbrain

Head of Labeling в Dbrain.

telegram: andrey_kiselev
ODS slack: akiselev

Тезисы

Мы в Dbrain разработали принципиально новую инфраструктуру для проведения конкурсов по машинному обучению.

В ходе соревнований на нашей платформе участники предоставляют отчуждаемый исходный код решений. Обучение моделей на клиентских данных, как и построение предсказаний на тестовых данных производится в нашем облаке. Лучшее решение автоматически превращается в API.

Таким образом, мы гарантируем полную репродуцируемость и отчуждаемость решений конкурса, а также защищаем данные клиента.

Я расскажу о создании такой инфраструктуры и попробую пофантазировать о том, как ее можно превратить во внутренний инструмент для работы ML-команд.

Machine Learning