Делаем Сбербанк Онлайн надежнее и надежнее: как мы готовимся к пиковым нагрузкам

Цифровая культура / CTO-трек

Архитектура больших проектов

Архитектурные паттерны
Отказоустойчивость
Архитектуры / другое
Методологии и процессы разработки ПО; Сроки и приоритеты
Большие проекты/команды
Модели руководства
Выбор стратегии долгосрочного развития, KPI
Продуктовая разработка
Антикризисный менеджмент
Обслуживание клиентов, техническая поддержка, обратная связь
Управление / другое
Enterprise-системы
Теория
Типовые ошибки
Проектный офис

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Предсказуемый и управляемый монолит при переходе на микросервисную архитектуру растерял достоинства и оброс кучей архитектурных проблем. Вы узнаете, на какие грабли наступил СБОЛ, как с ними справился, как готовится к пикам нагрузки и что делает, если подготовка не помогла.

Целевая аудитория

PO, PM, СТО, Team Lead.

Тезисы

Отказоустойчивость финансового сервиса критически важна для наших клиентов. Мы строим свои процессы так, чтобы гарантировать вам уверенность. Высоконагруженный проект, регулярно меняющийся ландшафт и 1000 изменений, которые происходят вокруг? Это то, с чем нам приходится регулярно работать.

В докладе на примере Сбербанк Онлайн — проекта с 79 млн. уникальных пользователей в месяц — рассмотрим принципы построения отказоустойчивой архитектуры, пройдя весь путь эволюции Сбербанк Онлайн.

А также:
1. Разберем, что делать, чтобы подготовить Сбербанк Онлайн к периоду высокой нагрузки.
2. Узнаем об особенностях нашей архитектуры.
3. Как и почему появился сервис: "Вход в СБОЛ по талонам".
4. Разберемся в том, почему построение отказоустойчивого финансового сервиса — это непростая задачка.

Привет-привет!

Я Арюткин Артём - СРО платформы для разработчиков в Авито, то есть занимаюсь developer expirience, а в прошлом
руковожу продуктовым и проектным офисом платформы для девелоперов в Яндексе в райдтех и е-ком.

А до того, я 8+ лет я помогал сделать Сбербанк онлайн надежнее.
Началось все с того, что нужно было написать маленькое ТЗ на внедрение Circuit breaker, а дальше все как в тумане:
рост с 7 млн.пользователей до 79 млн., уникальные вопросы (посмотрим, как вы отнесетесь, если вам не хватает денег на карте, чтобы оплатить покупку, а сервис пополнения недоступен. Это вам не сломавшиеся фоточки), проектирование отказоустойчивой архитектуры, масштабирование всего и вся.
И вот, я уже Head of PMO, за спиной распил того самого монолита СБОЛа, который столько лет пилил, 500+ микро сервисов и 180 тыс.входов клиентов в минуту.

И тут бы сказать себе - все офигенно, наконец-то можно расслабиться, но так дела не делаются.

Поэтому я стал директором по технологическому развитию в департаменте данных и рекомендательных систем. Ага, это те самые, которые вам рекомендуют купить чехол, когда вы купили iPhone или присылают смс с предложением по кредитной карте или рекомендуют вам фильмец на вечер.

А еще у нас в обойме MDM система на 107+ млн.клиентов, кросс продуктовый кэш для всего банка - это когда у тебя никто не ходит в процессинг и другие АБС на прямую, а ходит к тебе: 70 + тыс.запросов в секунду.

А что там делал я?
1. Отвеча за техническую повестку: переход на новый тех.стек (отказ от Oracle, OSE и т.п.)
2. Повышение эффективности разработки: новые практики, расшивание узких мест и т.п.
3. AI-фикация производства: использование AI на всех этапах производственного конвейера.

Авито

Авито

Видео