Доклад рассматривает роль Greenplum (GP) в текущей аналитической платформе и ожиданиях по фичам, которые должны были появиться с выходом GP 7. Но после закрытия проекта как Open Source-решения, сроки доступной production-ready сборки GP 7 сдвинулись на неопределенный срок.
Обсуждаются ключевые критерии выбора новых решений, таких как масштабируемость и совместимость. Посмотрим на альтернативы с акцентом на концепцию Data Lake House (DLH). Разберем преимущества технологий для реализации DLH: Iceberg, Trino и S3 и что делает их привлекательными для современных проектов.
В заключение перейдем к практике. Разберем успешный кейс внедрения production DLH для обработки данных clickstream, с которыми на Greenplum работать ресурсоемко.