Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

7 и 8 ноября 2019 Москва, Сколково

Cluster and Resource Management at Facebook Архитектуры, масштабируемость

Доклад принят в программу конференции

Артемий Колесников

Facebook

Работает в Facebook над системой управления кластером.

wheels@fb.com

Тезисы

Зал «Дели + Калькутта»

8 ноября, 12:00

Доклад посвящен тому, как мы построили низкоуровневую систему управления вычислительными ресурсами Facebook — Resource Broker. Этот компонент предоставляет базовый API и хранилище для Service Management систем следующего по стеку уровня — сервисные аллокаторы и шедулеры. К системам подобного рода применяются весьма жесткие требования по надежности и отсутствию зависимостей. Из-за этого, например, мы используем специально написанное для Resource Broker хранилище данных — Delos, так как не можем использовать общее хранилище, которое будучи внутренним сервисом Facebook опосредованно управляется Resource Broker'ом.

В качестве одного из примеров использования этой системы я рассажу, как мы выполняем автоматизированное выведение серверов из продакшна как для планового обслуживания (maintenance), так и в качестве реакции на какие-либо неполадки на сервере. Все это выполняется в автоматизированном режиме для миллионов контейнеров, на которых запущены сервисы Facebook.

Подготовительное задание

Ресурсы для чтения:
Общее описание Cluster Management-архитектуры — https://engineering.fb.com/data-center-engineering/tupperware/
Описание архитектуры хранилища, которое используется компонентами Cluster Management — https://engineering.fb.com/data-center-engineering/delos/
Высокоуровневое описание проекта.

Другие доклады секции Архитектуры, масштабируемость

Как устроена многопоточность в Hazelcast

Владимир Озеров

Querify Labs

Архитектура Мессенджера Авито – путь одного сообщения

Александр Емелин

Авито

Risk Control System, или Антифрод-перезагрузка

Федор Васильев

xStack

Реализация асинхронного фреймворка на базе Nginx: асинхронные задачи и сервисы на примере nginx-haskell-module

Алексей Радьков

DINS

Паттерны проектирования приложений на Apache Kafka

Александр Сибиряков

Scrapinghub

Жизнь без блокировок: не только lock-free и не только коллекции

Андрей Гончаров

Центр Речевых Технологий

Кафка. "Описание одной борьбы"

Денис Карасик

Badoo

Как выбрать SDN для высоких нагрузок и с наибольшим потенциалом роста

Александр Попов

VK Tech, VK Cloud

У одного моего друга, не у меня, есть опыт работы с SAGA

Дмитрий Химион

X5 Digital

Основы велосипедостроения при репликации данных между дата-центрами

Евгений Кузовлев

Т-Банк

Эффективные надежные микросервисы

Олег Анастасьев

Одноклассники

Когда работает не только на твоем ноутбуке. Опыт управления сетью в облаке

Дмитрий Бурмистров

VK Cloud Solutions

Игра на выживание: запуск трансляций Английской Премьер-лиги в новом формате

Алексей Голубев

Okko

Почему вам нужна платформа межсервисного взаимодействия и как её построить уже сегодня?

Артемий Рябинков

Unity

5 лет в А.Д.у - Расчет цепочки поставок - ДДД Эванса на практике - Взгляд в будущее на 21 день

Артём Цурков

Сеть Связной

Архитектура программно-определяемого сервера для задач вертикального масштабирования — теория и практика

Роман Тимофеев

Selectel

Языки, платформы, версии: масштабируем локализацию

Алексей Тимин

Badoo

Starship Enterprise Evolution: архитектура e-commerce-платформы

Алексей Скоробогатый

Lamoda

Автоназначение курьеров в Delivery Club, или Безопасные эксперименты в логистике

Денис Горев

Delivery Club

Персонализация за 10 миллисекунд, или Как tinkoff.ru подстраивается под вас

Владимир Посвянский

Tinkoff

Хьюстон, у нас проблема. Дизайн систем на отказ, паттерны разработки внутренних сервисов облака Amazon

Василий Пантюхин

Amazon Web Services

Заключая контракт: как осуществить хороший API для (микро)сервиса

Анна Мелехова

Лаборатория Касперского

Map-Reduce-операция длиною в год: архитектура отказоустойчивого планировщика batch-задач в системе Yandex.YT

Максим Ахмедов

Яндекс

Yandex Cloud Instance Groups: опыт создания сервиса оркестрации

Василий Бригинец

Яндекс.Облако

Микросервисная операционная среда для высоконагруженных вычислений в АСУ ТП АЭС

Вадим Подольный

Аквариус

Low Latency при работе с данными - какие бывают кейсы и как с ними работать

Евгений Журавлев

GridGain

Контакты

+7 (495) 646-07-68 support@ontico.ru 125040, Москва, Нижняя ул., д. 14, стр. 7, подъезд 1, оф. 16 ООО «Конференции Олега Бунина»

Служба поддержки и бухгалтерия: support@ontico.ru Сотрудничество: organization@ontico.ru Для докладчиков: — DevOps-секции: speakers.devops@ontico.ru — Остальные секции: speakers.highload@ontico.ru

Конференции

Календарь Россия IV Нормы поведения
на конференции

Правовая информация

Публичная оферта Соглашение на обработку персональных данных Политика обработки персональных данных
Лицензионный договор с Автором Контентная политика конференции