YTsaurus: опыт эксплуатации хранилища из 180К дисков

Базы данных и системы хранения

Хранилища данных

Отказоустойчивость
Распределенные системы
Управление конфигурацией
Хранилища
Инфраструктура

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Яндекс выложил в open source свое файловое хранилище для map reduce. На его примере вы узнаете, как сделать действительно огромную сетевую файловую систему и почему эта разработка радикально отличается от уже существующих решений вроде HDFS и CEPH.

Целевая аудитория

Разработчики и администраторы распределённых систем хранения и баз данных (HDFS, Cassandra, Greenplum). Все, кто хочет узнать об архитектурных решениях в эксабайтном хранилище и практическом опыте их применения.

Тезисы

YTsaurus — основная платформа Яндекса для хранения и обработки больших данных, ad hoc-аналитики, построения ETL-задач и регулярных batch-процессов. Сегодня самый большой кластер YTsaurus содержит более 20К хостов различной конфигурации — от 4 до 24 дисков, суммарно более 180К дисков.

В докладе я расскажу, как мы управляем таким количеством дисков с минимальными операционными издержками. Затронем:
* политики размещения блобов, для достижения отказоустойчивости и производительности записи;
* защитные механизмы, для ограничения фоновых процессов при восстановлении erasure-реплик;
* способы изоляции разных классов IO-нагрузки в одном кластере;
* инструменты автоматизации и примеры проблем, с которыми мы сталкивались при их внедрении.

Занимается разработкой системы YTsaurus с 2010 года. Принимает участие в разработке архитектуры системы, в разные годы занимался форматами хранения данных, подсистемой Map-Reduce-операций, запуском и изоляцией джобов, интеграцией с системами контейнеризации. Сейчас отвечает за эксплуатацию кластеров.

Яндекс

Яндекс — технологическая компания, создающая инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов разрабатывает одну из самых популярных поисковых систем и другие сервисы, которые помогают людям в их повседневной жизни. Среди его направлений деятельности: поиск, реклама, онлайн-заказ такси и еды, электронная коммерция, видео/аудио и потоковое вещание, автономное вождение и облачные сервисы. Яндекс активно развивает проекты с открытым исходным кодом, такие как CatBoost, DivKit, YDB, userver, YaLM, YTsaurus.

Видео

Другие доклады секции

Базы данных и системы хранения