Метрики дисков в облаке: от SPDK до promql

Базы данных и системы хранения

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

системные инженеры, SRE специалисты

Тезисы

Покупая виртуальную машину у облачного провайдера, мы платим деньги за квоту ресурсов. И нужно следить за тем, как квота утилизируется. Поэтому observability является важным аспектом для всех облаков.
Когда мы решали задачу сбора метрик облачных дисков, у нас было три важных аспекта:
1) мы поддерживаем разные типы дисков
2) есть общепринятый список метрик, которые нужно поддержать
3) наше observability не должно влиять на пользователя
Оказалось, что все поставленные задачи можно решить на уровне SPDK, который мы используем у себя на backend.
В докладе расскажем, как устроен datapath SPDK, и как туда вписывается агрегация и сбор метрик. Что в его observability доступно из коробки, а что несложно доделать самим. И наконец покажем итоговую схему, в которой данные изнутри SPDK у нас представляются в классическом prometheus формате и обрабатываются стандартными коллекторами метрик

Ведущий разработчик в команде Data Storage MWS Cloud Platform, преподаватель в университете ИТМО. Занимается системной разработкой.

Видео

Другие доклады секции

Базы данных и системы хранения