Prod, do stack: production-ready-решения через data science-конкурсыBigData и машинное обучение
Доклад принят в программу конференции
Тезисы
Мы в Dbrain разработали принципиально новую инфраструктуру для проведения конкурсов по машинному обучению.
В ходе соревнований на нашей платформе участники предоставляют отчуждаемый исходный код решений. Обучение моделей на клиентских данных, как и построение предсказаний на тестовых данных производится в нашем облаке. Лучшее решение автоматически превращается в API.
Таким образом, мы гарантируем полную репродуцируемость и отчуждаемость решений конкурса, а также защищаем данные клиента.
Я расскажу о создании такой инфраструктуры и попробую пофантазировать о том, как ее можно превратить во внутренний инструмент для работы ML-команд.
Другие доклады секции BigData и машинное обучение
Жизненный цикл ML в боевых условиях
Сергей Виноградов
Front Tier, РАНХиГС
Big-Data-процессинг пользовательских данных из соцсетей в AlibabaCloud MaxCompute
Максим Алексеев
Alibaba.com (RU), AliExpress
Медицинский чат-бот и система оценки врачей, или Как DS применяется в медицине уже сегодня
Илья Ларченко
DOC+
Прогнозирование продаж интернет-магазина с помощью градиентного бустинга (lightGBM)
Александр Алексейцев
OZON.RU