Отказоустойчивость как инструмент для оптимизации инфраструктурных расходов
Программный комитет ещё не принял решения по этому докладу
Целевая аудитория
Тезисы
Отказоустойчивость обычно рассматривают как ответ на пиковые нагрузки и большие потери от простоя: распродажи, релиз громкого контента или события. В этой модели инфраструктура считается стабильной, а основная задача — выдержать всплеск трафика. Для компаний среднего размера такой подход часто не окупается: стоимость простоя ниже, чем цена сложной архитектуры.
В Авиасейлс мы смотрим на это иначе: делаем систему отказоустойчивой, чтобы сэкономить на инфраструктуре.
На воркшопе мы будем работать с учебным Kubernetes-кластером на Spot-инстансах, где внезапное отключение серверов — нормальный режим работы. Участники подключатся к окружению с имитацией реального трафика и увидят, как сервисы работают в условиях регулярной потери нод. Цель воркшопа — шаг за шагом превратить такую систему из хрупкой в устойчивую, не увеличивая затраты на инфраструктуру.
Руководитель команды бэкенд-разработчиков, отвечающих за поисковой движок в Авиасейлс. Развивает основной продукт компании, принимает сложные технические решения на стыке cost-effectiveness и SLA.
6 лет занимается внедрением ML-решений на бэкенде. До Авиасейлс работал во Вконтакте над системами детекции спама, а на текущем месте первой задачей Сергея стало создание скора авиабилетов на основе машинного обучения. Хорошо понимает, как эффективно интегрировать ML в высоконагруженные системы и какие технические и бизнес-компромиссы это влечет за собой.
6 лет в IT. Прошел путь от разработчика до разработчика
Видео
Другие доклады секции
Архитектура и масштабируемость