Как построить Data Lineage на логах Apache Spark
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Data Lineage повышает надежность и упрощает работу с большими хранилищами данных.
Расскажу, как мы сделали решение по отслеживанию потоков данных от источников до конечного назначения для Apache Spark в одном из крупнейших хранилищ страны.
Слушатели смогут понять, как развернуть Data Lineage в своей компании, как его можно использовать и какие есть ограничения.
Руководитель команд разработки витрин
Сбер
Видео
Другие доклады секции
BigData и инфраструктура машинного обучения (data engineering)