Realtime-балансировка low-latency сервисов
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Как балансировать нагрузку в low-latency приложений без сложной распределённой координации? Расскажем про подход, где уровень принимаемой нагрузки определяется динамически для каждого инстанса, адаптируясь к текущему состоянию системы и железа.
В Маркете это решение в базовом поиске позволило снизить CPU примерно на 10% при реализации всего в ~700 строк кода.
2 года в IT. Занимался микросервизацией поискового монолита Яндекс.Маркета. Внедрид механизм балансировки нагрузки для low-latency сервисов Ecom & Ridetech
Видео
Другие доклады секции
Архитектура и масштабируемость