- Главная
- →
- DevOps и эксплуатация
One-cloud - система управления дата-центром в Одноклассниках DevOps и эксплуатация
Начал карьеру программиста в далеком 1995 году. Разрабатывал ПО в банковской сфере, телекоме, транспорте. Работает главным инженером в Одноклассниках. В его обязанности входит разработка архитектур и решений для высоконагруженных систем, больших хранилищ данных, решение проблем производительности и надежности портала.
Тезисы
Одноклассники состоят из более чем восьми тысяч железных серверов, расположенных в нескольких дата-центрах. Каждая из этих машин была специализированной под конкретную задачу - как для обеспечения изоляции отказов, так и для обеспечения автоматизированного управления инфраструктурой.
В определенный момент мы поняли, что внедрение новой системы управления позволит нам более эффективно загрузить технику, облегчить управление доступами, автоматизировать (пере)распределение вычислительных ресурсов, ускорить запуск новых сервисов, ускорить реакции на масштабные аварии.
В данном докладе расскажу об основных принципах и процессах, лежащих в основе нашего облака; наиболее интересных деталях его реализации; об обеспечении отказоустойчивости как самого облака, так и выполняемых им задач; нашем подходе к изоляции задач и повышения плотности использования техники.
Также затронем темы реальной эксплуатации как самого облака, так и задач в нем.