Сопровождение #каквсбере-СУБД на Java в критичных системах

Эксплуатация систем

Java
Базы данных / другое
Логи, метрики, ошибки
DevOps / SRE

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Доклад про то, что траблшутинг высоконагруженных систем заставляет залезать в такие дебри, про которые редко задумываешься, когда читаешь гайды по настройке в интернете.

Целевая аудитория

Инженеры сопровождения и разработчики высоконагруженных Java-приложений.

Тезисы

Наша команда в СберТехе разрабатывает и сопровождает СУБД Platform V DataGrid (aka Apache Ignite SberEdition), которая используется в Сбере в 200+ системах и развернута на 5000+ серверах.

За время работы нашей команды мы встретили и решили много интересных задач, и нам есть чем поделиться. Расскажу о том, как построено сопровождение DataGrid.

А на примере двух задач покажу, как мы расследуем проблемы в работе сложного Java-приложения, как находим их корневые причины, а также какую диагностическую информацию мы анализируем в процессе разбора.

Инженер Customer Success Team.
Развивает Platform V DataGrid, а вместе с ним и Apache Ignite.
Трудовой опыт Ильи связан с сопровождением, внедрением и развитием автоматизированных систем.

Видео