DDoS на серверсайд: как мы выжили при x3-нагрузке с ограниченными ресурсами

Архитектура и масштабируемость

Отказоустойчивость
Архитектуры / другое
Работа с облачными сервисами
Поддержка и развитие legacy систем

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Что делать, когда DDoS приходит, откуда не ждали: изнутри, а не извне? Проблемы с ресурсами в облаке и трафик растёт в три раза? История выживания и улучшения highload-сервиса: от тушения пожаров до Tier-B-надежности за полгода. Service mesh, адаптивные таймауты и боевые учения.

Целевая аудитория

Senior-разработчики, архитекторы высоконагруженных систем, разработчики масштабируемых систем.

Тезисы

После миграции в облако нас ждал сюрприз: обещанные «бесконечные» ресурсы закончились, а DDoS-атаки начали приходить через внутренние сервисы, минуя фронтальную защиту. При росте нагрузки на 30% и жестком SLA в 300мс мы оказались в критической ситуации.

Расскажу, как мы доработали архитектуру сервиса подбора рекламы: внедрили service mesh на Consul, реализовали динамические таймауты и умную деградацию без потери выручки. Покажу реальные графики DDoS-атак с трехкратным ростом трафика и нашу реакцию за секунды.

Что заберете с доклада:
* Схему архитектуры на service-mesh для защиты от резкого роста трафика или пропадания.
* Алгоритмы динамических таймаутов.
* Методику проведения учений DC-1 (снизили время восстановления с 30 до 5 минут).
* Механизмы деградации без импакта на выручку.
* Чек-лист перехода на cross-DC-архитектуру.

Все из реального продакшена с цифрами и графиками.

Артем Букин

VK, VK Реклама

Backend-разработчик в VK Рекламе. Основное направление разработки — ядро баннерного демона. В рамках проекта решает инфраструктурные и продуктовые задачи. Имеет богатый опыт embedded-разработки для встраиваемых систем.

Видео

Другие доклады секции

Архитектура и масштабируемость