Что делать, когда минута простоя стоит 100000$DevOps и эксплуатация
Более 15 лет опыта создания сложных и геораспределенных систем. Архитектор первой распределенной облачной российской медицинской системы smartmedicina.ru. Строил и масштабировал европейского эквайра ecommpay.com.
В настоящее время CTO в Т-Банке.
Все рассказывают про процессы разработки и тестирования, обучения персонала, повышение мотивации, но этих процессов мало, когда минута простоя сервиса стоит космических денег. Что делать, когда вы проводите финансовые транзакции под жесткий SLA? Как повысить надежность и отказоустойчивость ваших систем, вынося за скобки разработку и тестирование?
Мы поговорим о практиках доставки приложений в production-среду, а также об инструментах эксплуатации распределенных сервис-ориентированных систем. Как максимально быстро узнавать, где возникла проблема? Как научится спокойно спать, эксплуатируя такие системы?