В связи с ростом количества клиентов и объема трафика VK Рекламы увеличивается объем данных в системе и потребление аппаратных ресурсов, поэтому повышается вероятность возникновения проблем. Чтобы снизить риски потерь в этих условиях, необходимо заниматься оптимизацией архитектуры сервиса и заранее позаботиться о том, как резко не деградировать при возникновении нештатных ситуаций с использованием принципа graceful degradation.
В рамках доклада расскажу, как:
* работает сервис подбора рекламы, и какие метрики анализируются;
* собрать инструменты для анализа состояния сервиса;
* от общих метрик перейти к частным, чтобы выявить узкие места;
* формулировать гипотезы и поставить эксперименты для оценки влияния на бизнес;
* своевременно выявить признаки начала деградации сервиса;
* на примере сервиса подбора рекламы реализовать механизмы плавной деградации;
* приемы оптимизации архитектуры сервиса.
С помощью предложенных методов можно повысить надежность высоконагруженного сервиса в процессе его постоянного развития, а также своевременно выявлять и диагностировать проблемы.