“Восстание машин” – это ок DevOps и эксплуатация
Ведущий разработчик в команде платформы проекта Одноклассники. Последние три года занимается разработкой внутреннего облака one-cloud, которое используется для запуска всех основных сервисов проекта.
Одноклассники состоят из более чем 6000 серверов, расположенных в нескольких дата-центрах. Почти половина из них являются частью нашего облака, one-cloud, про которое мы уже рассказывали два года назад на HighLoad++.
При управлении более чем 10000 контейнеров возникают типовые задачи, выполнение которых вручную отнимало бы слишком много времени и неизбежно приводило бы к человеческим ошибкам. Поэтому мы стремимся автоматизировать все процессы в облаке так, чтобы минимизировать участие человека. Такую полную автоматизацию мы назвали “Восстание машин”.
В докладе мы рассмотрим такие темы, как:
- выкладка секьюрити-патчей на все контейнеры. Заодно, научимся подменять слои docker-образа за 1 секунду;
- обеспечение доступности распределенных statefull-сервисов при операциях в облаке;
- проблема фрагментации в облаке. Расскажем, как с помощью изменения алгоритма размещения мы сэкономили миллион долларов.