Восстание машин или как хранилища Sage на новое железо заезжали

Архитектура и масштабируемость

Хранилища
Железо
Инфраструктура
Расширение кругозора

Доклад принят в программу конференции

Целевая аудитория

Архитекторы, SRE, DevOps, разработчики

Тезисы

В основе работы любого приложения всегда лежит железо. Оно может дать как буст нашему приложению, так и забрать "силы" у него. Но мы настолько привыкли к облачным решениям и Kubernetes (K8s), что уже просто забываем про эту истину.

Мы – Sage в Т-Банке. Мы владеем большим количеством инфраструктуры(серверов), на которое запускаем наши хранилища.

И вот мы получаем партию серверов от нового для нас вендора. И казалось бы, что же могло пойти не так? Мы же уже столько раз разворачивали наши Elasticsearch (ES), но именно в этот раз железо решило преподать нам урок. Наши плановые 2 недели превратились в 6+ месяцев.

Из доклада вы узнаете:
1. Архитектуру современного сервера глазами: процессоры, память, riser и RAID-контроллер
2. Наш опыт запуска ES на новом железе и на какие проблемы с аппаратным обеспечением (hardware) мы наткнулись.
3. Как при этом вел себя ES или сервер, и как мы доказывали что проблема не в приложении, а на уровне железа.
4. Как эти проблемы были решены и какие выводы мы сделали на будущее.

Доклад будет интересен как экспертам, так и начинающим.

Опыт в IT более 15 лет. Последние несколько лет является SRE-инженером в Т-Банке в команде Sage.

За свою карьеру успешно выполнял различные роли, в том числе разработчика, архитектора и управленца. Как правило, всегда работает над задачами с высокой неопределенностью.

https://www.linkedin.com/in/ruslan-boyarskiy/

Видео