Распределенные графовые СУБД — будущее для аналитики на Больших Данных?

Базы данных и системы хранения

Распределенные системы / распределенные СУБД

Базы данных / другое
Machine Learning
Хранилища
Обработка данных

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Графовые СУБД становятся популярными в аналитике, несмотря на прежние сомнения в производительности и масштабируемости. В будущем графовые СУБД могут стать лидерами в аналитике Больших Данных.

Целевая аудитория

Архитекторы баз данных, CDO, Data Scientists, Data Engineers, Machine Learning practitioners.

Тезисы

Графовые СУБД в последнее время стали очень популярны для аналитических задач. Традиционно к графовым СУБД относились скептически из-за их производительности и масштабируемости: например, очень популярная СУБД Neo4j пока практически не масштабируется на несколько узлов. Но появились новые системы, изначально разработанные как распределенные графовые СУБД, которые в состоянии уже хранить и обрабатывать десятки терабайт данных, а в скором будущем смогут масштабироваться до петабайт.

В чем существенные отличия графовых СУБД, какие преимущества и новые методы они предлагают для аналитики, и почему будущее аналитики на Больших Данных может оказаться именно за графовыми СУБД?

Руководитель команды оптимизатора YDB.
Некоторые прошлые проекты: Enosys Integration Server (сейчас часть Oracle), Sedna XML DBMS, система Texterra (Институт Системного Программирования), SciDB MPP DBMS, News360, Huawei GaussDB, TigerGraph.

Yandex Cloud

Строят публичную облачную платформу Yandex Cloud, чтобы дать компаниям доступ к технологиям и сервисам, которые проверены нагрузками Яндекса. Продукты Yandex Cloud — это масштабируемая инфраструктура, сервисы хранения данных, инструменты машинного обучения и средства разработки.

Видео

Другие доклады секции

Базы данных и системы хранения