Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Жизнь после Greenplum: выбор Open Source решения для аналитики

BigData и инфраструктура машинного обучения (data engineering)

Доклад принят в программу конференции

Целевая аудитория

Архитекторы и разработчики платформы данных, так же будет интересно для инженеров и аналитиков данных.

Тезисы

Доклад рассматривает роль Greenplum в текущей аналитической платформе и ожиданиях, которые питали с выходом Greenplum 7. Но все изменилось после закрытия проекта как open source решения.

Обсуждаются ключевые критерии выбора новых решений, таких как масштабируемость и совместимость. Посмотрим на альтернатиы, с акцентом на концепцию Data Lake House (DLH). Разберем преимущества технологий для реализации DLH: Iceberg, Trino и S3 и, что делает их привлекательными для современных проектов.

В заключение перейдем к практике, разберем успешный кейс и проблемы, с которыми столкнулись при переходе с GP на DLH.

Петр Гуринов

"Лемана ПРО (Леруа Мерлен)"

Руководитель практики инженерии данных в Лемана ПРО (Леруа Мерлен). Отвечаю за рост дата-инженеров в компании, запускаю RnD-проекты, внедряю lakehouse.

"Лемана ПРО (Леруа Мерлен)"

Создаём IT-инфраструктуру, которая улучшает клиентский опыт и делает его бесшовным. Например, предлагает услуги по проектированию дома, решает проблемы с логистикой или позволяет покупать товары любым удобным способом — онлайн, в магазине или по телефону.

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)