Как регулярно строить всё больше ML-пулов на MapReduce, а дежурить все меньше

BigData и машинное обучение

Архитектура ML / MLOps

Python

ETL

Надёжность продакшена

Автотесты

Обработка данных

Инфраструктура

13 мая, 10:00, Зал «Ахиллес»

Google Outlook Apple

Доклад принят в программу конференции

Целевая аудитория

Разработчики поставки данных для машинного обучения и расчета статистик.

Тезисы

Скачать презентацию Все презентации конференции

Изначально наши пулы строились набором python-скриптов, запускаемых по cron'у. Когда число таких скриптов перевалило за 100, ситуация вышла из-под контроля. Починка прода стала занимать всё рабочее время, а любая выкатка стала подвигом. Мы решили переписать систему, чтоб исправить это, и теперь поделимся опытом.

Мы расскажем:
* как организуем разработку новых MR-задач, чтобы не тратить много сил на ревью;
* как тестируем новые задачи, чтобы (почти) не бояться выкатывать их в production;
* как выстраиваем дежурство, чтобы не чинить пайплайны все рабочее время.

Илария Белова

Яндекс

Сore-разработчик Logos.

Закончила ШАД, 8 лет в Яндексе, раньше занималась ML, теперь инфраструктурой.

Яндекс

Яндекс — технологическая компания, которая создаёт инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов развивает самую популярную в России поисковую систему и более 85 пользовательских сервисов, которые помогают людям в повседневных заботах. Основные бизнес-направления: поиск и электронная коммерция, сервисы объявлений, медиасервисы, онлайн-заказ такси и еды, беспилотные автомобили, продукты для рекламодателей и владельцев бизнеса. Яндекс также активно развивает проекты с открытым исходным кодом, например, библиотеку машинного обучения CatBoost.

Никита Путинцев

Яндекс

Руководитель группы развития инструментов поставки данных.

Занимается ML и инфраструктурой. Закончил ШАД. В Яндексе шесть лет.
Подтемы для консультации:
* пайплайны для построения регулярных датасетов;
* их CI/CD и тестирование;
* data lineage;
* релизный процесс для моделей.

Яндекс