Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

"Акведук": open source для быстрого ML в продакшне

BigData и машинное обучение

Архитектура ML / MLOps

Фреймворки
Python
Асинхронное программирование, реактивное программирование
Разработка библиотек, включая open source библиотеки
Архитектура данных, потоки данных, версионирование
Архитектуры / другое
Machine Learning

Доклад принят в программу конференции

Целевая аудитория

Бэкенд-разработчики (Python), data-инженеры, ML-инженеры, data science-специалисты.

Тезисы

В нашей команде более 40 однотипных ML-микросервисов, и их число постоянно растет. Перед бэкенд-инженерами стоят задачи обеспечения максимального RPS, оптимизации использования железа и централизованного распространения лучших практик и фич между сервисами.

В результате решения этих задач появился фреймворк «Акведук», позволяющий описать пайплайн обработки данных, концентрируясь на его логическом устройстве, а не технических деталях.

С технической точки зрения Акведук представляет собой легковесную Python-библиотеку, активно использующую возможности пакетов 'multiprocessing' и 'asyncio', что позволяет значительно повысить утилизацию инференс серверов.

В своем докладе я подробно расскажу, как мы пришли к идее и усовершенствовали наш фреймворк, сравню с другими известными решениями и дам практические рекомендации по использованию Акведука.

Бэкенд-инженер в DS-команде.

Авито

На Авито каждый может найти что-то своё среди миллионов частных объявлений и предложений компаний по всей России: от квартиры и автомобиля до работы и кандидатов на вакансии. Сервис делают 800 инженеров. У них небольшой монолит на PHP, больше тысячи микросервисов на Go и Python, фронтенд на JavaScript, базы данных PostgreSQL, MongoDB и Redis, автоматические тесты, обученная на данных система модерации и поисковый движок Sphinx. Продуктом каждый месяц пользуется треть населения России. avito.tech

Видео

Другие доклады секции

BigData и машинное обучение