ML на автопилоте: контроль данных и автоматическое переобучение моделей

Data Engineering

Надёжность продакшена
ML

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Доклад будет полезен ML-инженерам и data-специалистам, работающим с production-ML и заинтересованным в надёжных и воспроизводимых MLOps-процессах.

Тезисы

Production-ML часто страдает не из-за моделей, а из-за данных и ручных процессов вокруг них: изменения в схемах, деградация качества данных и нерегулярное переобучение приводят к инцидентам и потере качества моделей.
В докладе мы расскажем о практическом опыте внедрения data tests для валидации данных на всех этапах ML-pipeline и continuous training — автоматического переобучения моделей на новых данных без ручного вмешательства. Эти подходы позволили повысить стабильность ML-систем и сократить операционные затраты на их поддержку.

Прошла путь от системного аналитика (4 года опыта) до ML-инженера. В настоящее время разрабатываю антифрод ML-модели и внедряю MLOps-подходы, направленные на автоматизацию и повышение надёжности production-ML. В работе активно оптимизирую процессы команды, снижая ручной труд и ускоряя вывод моделей в production.

Имею опыт работы инженером по информационной безопасности и системным аналитиком, в настоящее время работаю ML-инженером. Занимаюсь разработкой антифрод ML-моделей и внедрением MLOps-подходов для автоматизации и повышения надёжности production-ML. Оптимизирую процессы команды, сокращая ручной труд и ускоряя вывод моделей в production.

Видео