Производительность etcd-кластера с множеством объектов — головная боль команд, которые любят и ценят кубернетес. И вот почему: чаще всего для роста производительности кластера используют горизонтальное скалирование, а это приводит к нагрузке на кластер из-за увеличения времени согласования записи данных. В результате вместо шустрого кластера получается неповоротливый тяжеловес. Мы в VK Cloud разогнали наш Managed Kubernetes под очень высокие нагрузки (500 000 объектов в кластере) и сохранили его производительность. В докладе расскажу, как мы провели тюнинг ectd-кластера, какие настройки нужны, чтобы повысить производительность Kubernetes-кластера. Рецепты пригодятся для команд, которые работают с Kubernetes в облаке и готовят его на своем железе.
* Почему горизонтальное масштабирование etcd-кластера — это плохо;
* почему etcd — это не про большие объемы, и какой опыт у Google, AWS;
* надо понимать, что хотите хранить в etcd;
* как перекосы в типах хранимых данных влияют на производительность и как это исправить;
* что нужно не хранить в etcd и выносить за пределы кластера;
* как одна ошибка в манифесте может заставить достичь лимитов Kubernetes и сломать его.