После миграции в облако нас ждал сюрприз: обещанные «бесконечные» ресурсы закончились, а DDoS-атаки начали приходить через внутренние сервисы, минуя фронтальную защиту. При росте нагрузки на 30% и жестком SLA в 300мс мы оказались в критической ситуации.
Расскажу, как мы доработали архитектуру сервиса подбора рекламы: внедрили service mesh на Consul, реализовали динамические таймауты и умную деградацию без потери выручки. Покажу реальные графики DDoS-атак с трехкратным ростом трафика и нашу реакцию за секунды.
Что заберете с доклада:
* Схему архитектуры на service-mesh для защиты от резкого роста трафика или пропадания.
* Алгоритмы динамических таймаутов.
* Методику проведения учений DC-1 (снизили время восстановления с 30 до 5 минут).
* Механизмы деградации без импакта на выручку.
* Чек-лист перехода на cross-DC-архитектуру.
Все из реального продакшена с цифрами и графиками.