Собственный S3-сервер — Lusca: проблемы построения стабильного хранилища в нестабильном мире

Базы данных и системы хранения

Доклад принят в программу конференции

Целевая аудитория

Рассказ рассчитан на бэкенд-разработчиков и инженеров эксплуатации, имеющих некоторый опыт работы с объектными хранилищами или wide-column базами данных (ScyllaDB/Cassandra), но может быть интересен всем, кто интересуется проектированием и разработкой больших инфраструктурных систем.

Тезисы

В 2024 году Ozon полностью перенес свою инфраструктуру объектного хранилища на собственное решение S3-server Lusca. В докладе я раскажу, как мы выбирали хранилища индекса; думали, как реализовать strong consistency на eventual consistency базе; открывали для себя особенности фоновых процессов ScyllaDB и придумывали свои алгоритмы; А еще о том, как боролись с восстанием зомби на Хеллоуин и воскрешали терабайты случайно удаленных данных.

Хотим поделиться опытом проектирования масштабных систем, пересборки большого космолета налету, рассказать об интересных вещах, которые мы для себя открыли, об ошибках, которые мы могли бы и не допустить, и просто о забавных ситуациях.

Сейчас руковожу отделом Object Storage в Ozon tech. Мне нравится чувствовать себя в центре событий, создавать большие высоконагруженные решения, руководить командой крутых специалистов, и наблюдать, как наши решения обеспечивают работу огромного, важного для людей и при этом смело развивающегося и динамично меняющегося бизнеса.

Ozon

Ozon Tech — это 6 000+ IT-специалистов в сотнях кросс-функциональных команд. Компания, которая обеспечивает бесперебойную работу десятков тысяч сотрудников и миллионов клиентов одного из самых популярных в России маркетплейсов. А ещё Ozon Tech — это: 6 500+ микросервисов, высокая доступность, отказоустойчивость, горизонтальное масштабирование, распределение нагрузки; уникальный и сложный highload: 4.3K заказов в секунду и до 175К RPS к бэкенду с мобильных приложений и сайта; 3 ЦОДа, 10 200 серверов и стораджей — у нас одна из крупнейших в РФ IT-платформа; суммарный объём аналитических хранилищ — 60 PB. Мы уникальный, взрослый и сложный highload. Если на рынке нет подходящих решений, мы разрабатываем собственные. И департамент платформы, в котором я работаю, играет в этих процессах одну из центральных ролей.

Видео