Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Опыт создания резервного и кластеризованного Zabbix-сервиса Системное администрирование

Доклад принят в программу конференции
Михаил Макуров
Интерсвязь

Работает в IT 12 лет, прошел путь от инженера до IT-директора (CIO). Активно участвует в высоконагруженных проектах по обработке трафика, в последнее время принимал участие в развитии Zabbix. Активно участвует в создании и поддержании местного IT-сообщества, которое проводит собственную IT-конференцию, собирая до 400 человек.

телеграм: @makurov
почта: makurov@gmail.com
Тезисы

Zabbix — популярная открытая система мониторинга, используется большим количеством компаний.
Я расскажу об опыте создания кластера мониторинга.

В докладе я коротко упомяну о сделанных ранее правках (патчах), которые существенно расширяют возможности системы и готовят базу для кластера (выгрузка истории в кликхаус, асинхронный поллинг). И подробно рассмотрю вопросы, возникшие при кластеризации системы — разрешение конфликтов идентификаторов в БД, немного о "CAP theorem" и мониторинге с распределенными БД, о нюансах работы Zabbix в кластерном режиме: резервирование и координирование работы серверов и прокси, о "доменах мониторинга" и новом взгляде на архитектуру системы.

Коротко расскажу о том, как запустить кластер у себя, где взять исходники, какие доп. настройки потребуются для кластера.

Отказоустойчивость
,
Распределенные системы
,
Логирование и мониторинг
,
Технологии отказоустойчивости и катастрофоустойчивости, бэкапы
Подготовительное задание

Если вы никогда не использовали Заббикс в продуктиве, установите одну из последних версий, настройте мониторинг нескольких хостов, настройте несколько прокси серверов, проверьте как ведет себя мниторинг при отключении сервера, а как - при отключении прокси.

Rambler's Top100