Highload++ 2017 завершён!

Профессиональная конференция разработчиков высоконагруженных систем

СКОЛКОВО, Москва 7 и 8 ноября

11-я ежегодная конференция для разработчиков highload-систем, которая соберет   2 700 участников из разных регионов России и мира. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Программа охватывает такие аспекты веб-разработок, как архитектуры крупных проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование, эксплуатация крупных проектов и другие направления, связанные с высоконагруженными системами.

Нереляционные системы хранения данных (HCS: хранение и обработка сверхбольших объемов иерархических данных)
Основная секция

Доклад принят в Программу конференции
Google

Работает в команде Google SRE в Дублине (Ирландия).

Тезисы

Hcs3
View SlideShare presentation or Upload your own.



Нереляционные системы хранения данных / Павел Уваров

Тезисы

Цель доклада – познакомить слушателей с концепцией потоковых баз данных, их достоинствами, недостатками и областью применимости.

Когда данных становится так много, что уместить их в обычную реляционную БД, такую как MySQL, становится проблематичным, приходится думать, как удобно организовать их хранение и обработку без лишних накладных расходов. Использование специально заточенных форматов негибко и трудоемко, поэтому нужно искать золотую середину между гибкостью универсальной БД и оптимальностью специальных форматов.

Так как данных очень много, то и обрабатывать их приходится большими пачками, поэтому мы неизбежно приходим к тому, чтобы ограничиться последовательной обработкой. Так возникает термин «потоковая база данных», т. е. БД, основанная на последовательной (пото- ковой) обработке.

Рассматривается пример реализации этой БД в Рамблере под названием HCS (Hierarchically Compressed Stream).

Помимо последовательного доступа, БД имеет возможность ограниченного случайного доступа, что делает ее привлекательным средством для построения поисковых индексов.

Целевая аудитория

Аудитория доклада – специалисты среднего и высокого уровня, участвующие в проектах (например, поисковик) по хранению, обработке и использованию сверхбольших объемов данных, иерархических по природе.

О докладчике

Павел Уваров, руководитель отдела поисковых технологий в Рамблере.

Контакты: puvar@rambler-co.ru

Другие доклады секции
Основная секция

Rambler's Top100