Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Как построить Data Lineage на логах Apache Spark

BigData и инфраструктура машинного обучения (data engineering)

Доклад принят в программу конференции

Целевая аудитория

CDO, Data-инженеры, Data-аналитики

Тезисы

Data Lineage повышает надежность и упрощает работу с большими хранилищами данных.
Расскажу, как мы сделали решение по отслеживанию потоков данных от источников до конечного назначения для Apache Spark в одном из крупнейших хранилищ страны.
Слушатели смогут понять, как развернуть Data Lineage в своей компании, как его можно использовать и какие есть ограничения.

Руководитель команд разработки витрин

Сбер

Сбер

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)