ML на автопилоте: контроль данных и автоматическое переобучение моделей
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Production-ML часто страдает не из-за моделей, а из-за данных и ручных процессов вокруг них: изменения в схемах, деградация качества данных и нерегулярное переобучение приводят к инцидентам и потере качества моделей.
В докладе мы расскажем о практическом опыте внедрения data tests для валидации данных на всех этапах ML-pipeline и continuous training — автоматического переобучения моделей на новых данных без ручного вмешательства. Эти подходы позволили повысить стабильность ML-систем и сократить операционные затраты на их поддержку.
Прошла путь от системного аналитика (4 года опыта) до ML-инженера. В настоящее время разрабатываю антифрод ML-модели и внедряю MLOps-подходы, направленные на автоматизацию и повышение надёжности production-ML. В работе активно оптимизирую процессы команды, снижая ручной труд и ускоряя вывод моделей в production.
Имею опыт работы инженером по информационной безопасности и системным аналитиком, в настоящее время работаю ML-инженером. Занимаюсь разработкой антифрод ML-моделей и внедрением MLOps-подходов для автоматизации и повышения надёжности production-ML. Оптимизирую процессы команды, сокращая ручной труд и ускоряя вывод моделей в production.
Видео
Другие доклады секции
Data Engineering