Восстание машин, или как хранилища Sage на новое железо заезжали

Архитектура и масштабируемость

Хранилища
Железо
Инфраструктура
Расширение кругозора

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Принято считать железо надежным и готовым к использованию из коробки, но это не так. В докладе интересный путь команды Sage, которая умудрилась наступить на массу граблей и столкнуться с «черными лебедями». Полезно будет сравнить их чек-лист проверки железа с вашим списком, если он у вас есть.

Целевая аудитория

Архитекторы, SRE, DevOps, разработчики.

Тезисы

В основе работы любого приложения всегда лежит железо. Оно может дать как буст нашему приложению, так и забрать «силы» у него. Но мы настолько привыкли к облачным решениям и Kubernetes (K8s), что уже просто забываем про эту истину.

Мы — Sage в Т-Банке. Мы владеем большим количеством инфраструктуры (серверов), на которое запускаем наши хранилища.

И вот мы получаем партию серверов от нового для нас вендора. И казалось бы, что же могло пойти не так? Мы же уже столько раз разворачивали наши Elasticsearch (ES), но именно в этот раз железо решило преподать нам урок.

Из доклада вы узнаете:
* Архитектуру современного сервера: процессоры, память, riser и RAID-контроллеры.
* Наш опыт запуска ES на новом железе и на какие проблемы с аппаратным обеспечением (hardware) мы наткнулись (наш «черный лебедь»).
* Как при этом вел себя ES нода или сервер и как мы доказывали, что проблема не в приложении, а на уровне железа.
* Как эти проблемы были решены и какие выводы были сделаны на будущее.

Доклад будет интересен как экспертам, так и начинающим.

Опыт в IT около 20 лет. Последние несколько лет является SRE-инженером в Т-Банке в команде Sage.

За свою карьеру успешно выполнял различные роли, в том числе разработчика, архитектора и управленца. Как правило, всегда работает над задачами с высокой неопределенностью.

https://www.linkedin.com/in/ruslan-boyarskiy/

Видео

Другие доклады секции

Архитектура и масштабируемость