Профессиональная конференция разработчиков высоконагруженных систем

Как мы делаем облачный Greenplum

Резерв

PostgreSQL
Базы данных / другое
Хранилища

Доклад отозван

Целевая аудитория

Аналитики, Инженеры данных, Администраторы баз данных, Системные администраторы, Разработчики БД

Тезисы

Greenplum - #49 в рейтинге БД на db-engines.com, а в России сейчас одна из самых востребованных аналитических БД.

Изначально разрабатывалась как on-premise решение, но мы смогли запустить её как managed database в Яндекс.Облако.

Доклад для тех, у кого есть, или планируются, неважно какая: on-premise или в облачная, инсталляции Greenplum. Задачи администрирования инфраструктуры все равно должен кто-то решать. Расскажу как они решаются у нас.

В докладе я расскажу как в облаке можно решать задачи:
- Обеспечении отказоустойчивости;
- Резервного копирования и восстановления;
- Реконфигурации БД.

Порассуждаю о наших планах, как сделать Greenplum еще облачнее:
- Compute и Storage separation;
- Data Sharing или как победить БД-монстр.

Поделюсь ссылками на open-source репозитарии, где можно взять наши (текущие и будущие) разработки.

В Яндексе с 2011 года. Начинал свой путь с администрирования больших коммерческих баз данных и аналитики, сейчас занимается разработкой сервиса управляемых баз данных Greenplum в Yandex Cloud.
Защитил диссертацию по оптимизации запросов в базы данных в МАИ.

Яндекс

Yandex Cloud - публичная облачная платформа, предоставляет крупным компаниям, среднему бизнесу и частным разработчикам более 50 взаимосвязанных сервисов: масштабируемую инфраструктуру, сервисы хранения, обработки и анализа данных, инструменты машинного обучения, средства разработки и сервисы для командной работы.

Видео