Круглый стол «Мониторинг, написанный кровью»

SRE и эксплуатация систем

Логирование и мониторинг
Observability в enterprise

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Круглый стол будет полезно посетить всем, кто интересуется реальным, кровавым опытом построения мониторинга в целом и отдельных его аспектов.

Целевая аудитория

Ops, инженеры эксплуатации, служба мониторинга, SRE

Тезисы

Ни для кого не секрет, что манифесты или конвенции по логированию пишутся кровью, болью и финансовыми потерями бизнеса из прошлого. Но есть ли такие метрики и настройки мониторинга, которые бы помогли это предотвратить или хотя бы предупредить? Кажется, что если при введении в эксплуатацию сервиса или системы предусмотреть максимальные точки отказа на слоях инфраструктуры и приложения, добавив метрики здоровья приложения, то можно нивелировать часть рисков, но так ли это? Об этом мы и поговорим, присоединяйтесь к нашей дискуссии.

Александр Крылов

Лаборатория Числитель

CPO продукта Штурвал компании Лаборатория Числитель.
Считает, что все, что можно унифицировать, стандартизировать и автоматизировать, можно и нужно унифицировать, стандартизировать и автоматизировать.
* в ИТ 12+ лет;
* глава ПК K8s day;
* член ПК Стачка, Merge, ProITFest, Performance conf;
* спикер DevOpsСonf, HighLoad++, TeamLead Сonf, Стачка, Merge, Dump, DevOops;
* автор курса «DevOps-инженер» в рамках проекта «Цифровые кафедры» вузов РФ (МИРЭА, МГТУ, МГМУ, ГТУ);
* соавтор и соведущий подкаста ProITStand, Brainstorm;
* автор курса по HAProxy и постоянный спикер направления DevOps в Rebrain.

SRE. Работал инженером в телекоме, после чего ушел в финтех. Руководил командой SRE/DevOps на крупном финтех-проекте. Занимался внедрением практик DevOps и инцидент-менеджмента. С 2021 года SRE-инженер в компании VK. Занимается развитием практик мониторинга, алертинга, инцидент-менеджмента. Преподаватель и спикер конференций.

Александр Тоцкий

Совкомбанк

Руководитель Департамента инфраструктуры и сопровождения систем Совкомбанка. В сфере информационных технологий с конца 1990-х гг. В банк пришел в 2012 году на должность главного специалиста по информационной безопасности. В последующие годы руководил ИТ‑проектами, связанными с присоединением и слияниями организаций, обеспечивая бесшовную интеграцию систем и сохранность данных. В 2020 году возглавил команду инфраструктуры, в 2023 году в зону ответственности включена также прикладная поддержка.

Денис Ефремов

Торговый дом Нефтьмагистраль

20+ лет в ИТ

Видео