OVN, техдолг и распределенка: переносим функции облачной сети в SDN из LXC

Архитектура и масштабируемость

Отказоустойчивость
Распределенные системы
Технологии виртуализации и контейнеризации
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
Инфраструктура как сервис (IaaS), платформы как сервис (PaaS)
Техдолг
Облака
Инфраструктура
Сеть

Доклад принят в программу конференции

Мнение Программного комитета о докладе

В распределенных системах классическая проблема — наличие централизованных точек обработки. Послушаем продолжение темы про миграцию на OVN и перенос обработки трафика на конечные точки, что позволяет добиться децентрализованной обработки. И все это — на опенсорсе!

Целевая аудитория

* Администраторы и разработчики облачных платформ и сред виртуализации. * Специалисты в разработке и эксплуатации Software-Defined Networking решений. * Сетевые инженеры.

Тезисы

После перехода с VMware NSX на open source SDN OVN, о котором я рассказывал на HL++ 2024, мы смогли вздохнуть полной грудью, получив прирост в производительности, быстродействии сети и, наконец, начали «владеть» продуктом, избавившись от вендорской закрытости. OVN, как и его предшественник NSX предоставлял в облачной сети L2-изоляцию между подсетями, firewall на портах ВМ, DHCP и возможность подключения внешних инфраструктур клиентов через HW VTEP (L2 Gateway).

В то же время остальные сетевые сервисы — DNS, межсетевой firewall, VPNaaS и маршрутизация VPC и зонами доступности — продолжали функционировать в LXC-контейнерах на выделенных сетевых нодах с использованием стандартных Linux-инструментов. Такое решение было простым и понятным, но имело свои ограничения.

Поэтому мы видели улучшение облачных сетей уже на базе более продвинутых фич OVN, которые должны были решить оставшиеся проблемы:

* Сетевая нода с LXC и veth-интерфейсами становилась узким местом с точки зрения производительности, особенно при росте нагрузки одного VPC.
* Использование conntrack для NAT добавляло нагрузки, что влияло на эффективность обработки внешнего трафика.
* Несмотря на компактность LXC, сосредоточение всех сетевых функций VPC в одном контейнере снижало гибкость при построении распределенных архитектур.

В докладе я расскажу, как мы выстроили новую архитектуру сетевых сервисов в К2 Облаке, чтобы решить эти задачи, повысить масштабируемость и отказоустойчивость, и какой ценой смогли этого достичь.

>13 лет работает в IТ, интересуется виртуализацией Сети, SDN, hardware accelleration.
Иногда достает поиграть гитару или даже Fender Precision Bass.
Катается на сноуборде и MTB.

Видео

Другие доклады секции

Архитектура и масштабируемость