80 кластеров и один новый каждую неделю. Как мы спасали Яндекс Трекер от роста.

Архитектура и масштабируемость

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

Понял — вот **короткая и максимально широкая формулировка**: --- Доклад рассчитан на широкий круг инженеров и специалистов, работающих с развитием и масштабированием цифровых сервисов. Будет полезен всем, кто интересуется архитектурой систем, надежностью, хранением данных и практиками проведения крупных изменений в продакшене.

Тезисы

Представьте: ваш сервис настолько популярен, что инфраструктура трещит по швам. Полтора года назад у нас в Яндекс Трекере было 80 кластеров, и мы поднимали по одному новому в неделю, чтобы просто пережить "горячий сезон". Поддержка превратилась в круглосуточную борьбу с огнем. Стало очевидно: нужно не тушить пожары, а перестраивать дом.

В докладе я поделюсь историей нашего большого проекта по оптимизации:

The Pain: Как мы жили с 80 кластерами и почему это был путь в никуда.
The Plan: Какие гипотезы проверяли и как пришли к новой архитектуре.
The Win: Как нам удалось пережить следующий пик нагрузки с гораздо меньшим количеством кластеров и какие инженерные подвиги для этого пришлось совершить.

Никакой воды — только наш опыт, грабли, на которые мы наступили, и финальный результат, который позволил нам расти дальше без головной боли.

Учился проектировать ракетные двигатели. Дрался с сусликом за обломки ракеты в Астраханской степи. Прошел Сбербанк от стажера до IT-лидера кластера. Создал и запустил продукт, которым пользуются сотрудники Сбербанка по всей стране.
В настоящий момент руковожу Backend командой Яндекс Трекера

Видео

Другие доклады секции

Архитектура и масштабируемость