Когда работает не только на твоем ноутбуке. Опыт управления сетью в облаке Архитектуры, масштабируемость
Разработчик IaaS-направления в облачной платформе VK Cloud Solutions. Последние несколько лет занимается разработкой Биллинга и сервисами управления и оркестрации облака.
Часто бывает необходимо написать ПО, которое что-либо автоматизирует. В контролируемой среде это не доставляет особых проблем. Однако не всегда возможно обеспечить приложению столь идеальные условия функционирования. Что угодно может пойти не так, особенно в распределённой системе.
Поломки железа, отказы соседних сервисов, потеря связанности между компонентами сети — всё это типичные условия эксплуатации любого облака, и мы должны штатно с этим работать. Как обрабатывать сбои, поддерживать систему в желаемом состоянии, обеспечивать быстроту настройки и предсказуемость её поведения?
При создании собственного SDN-решения мы постарались следовать принципам построения автоматических систем с замкнутым контуром управления. На примере разработки контроллера SDN мы расскажем о причинах нашего выбора, пользе и практике применения системы обратной связи, а также о том, как этот путь повышает качество наших систем и защищает от многих аварий, в том числе таких непоправимых, как потеря пользовательских данных.
Мы глубоко убеждены, что такой подход может и должен применяться в сервисной и инфраструктурной разработке чаще, чем это есть сейчас.