Распределенные графовые СУБД — будущее для аналитики на Больших Данных?

Базы данных и системы хранения

Распределенные системы / распределенные СУБД

Базы данных / другое
Machine Learning
Хранилища
Обработка данных

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Графовые СУБД становятся популярными в аналитике, несмотря на прежние сомнения в производительности и масштабируемости. В будущем графовые СУБД могут стать лидерами в аналитике Больших Данных.

Целевая аудитория

Архитекторы баз данных, CDO, Data Scientists, Data Engineers, Machine Learning practitioners.

Тезисы

Графовые СУБД в последнее время стали очень популярны для аналитических задач. Традиционно к графовым СУБД относились скептически из-за их производительности и масштабируемости: например, очень популярная СУБД Neo4j пока практически не масштабируется на несколько узлов. Но появились новые системы, изначально разработанные как распределенные графовые СУБД, которые в состоянии уже хранить и обрабатывать десятки терабайт данных, а в скором будущем смогут масштабироваться до петабайт.

В чем существенные отличия графовых СУБД, какие преимущества и новые методы они предлагают для аналитики, и почему будущее аналитики на Больших Данных может оказаться именно за графовыми СУБД?

Павел Велихов

Yandex.Cloud (YDB)

Руководитель команды оптимизатора YDB.
Некоторые прошлые проекты: Enosys Integration Server (сейчас часть Oracle), Sedna XML DBMS, система Texterra (Институт Системного Программирования), SciDB MPP DBMS, News360, Huawei GaussDB, TigerGraph

Yandex.Cloud (YDB)

YDB — это распределённая отказоустойчивая Distributed SQL база данных с открытым исходным кодом, которая сочетает в себе высокую доступность и масштабируемость со строгой согласованностью и транзакциями ACID. Она поддерживает одновременное выполнение транзакционных (OLTP), аналитических (OLAP) и потоковых нагрузок.

Видео

Другие доклады секции

Базы данных и системы хранения