Аудит SRE
Аудит SRE — это проверка надежности облачной инфраструктуры проекта. В ходе аудита мы оцениваем:
стабильность инфраструктуры,
готовность инфраструктуры к масштабированию,
эффективность процессов мониторинга и управления инцидентами в инфраструктуре,
надежность процессов резервирования и резервного копирования.
Показания к применению
Регулярное возниковение инцидентов, приводящих к длительному даунтайму системы или её компонентов
Дестабилизация работы проекта при повышении нагрузки
Отсутствие объяснения причин аварии в системе мониторинга.
Постоянные сбои систем резервирования и резервного копирования.
Из чего состоит аудит?
Аудит системы мониторинга
анализ инструментов мониторинга
оценка полноты и качества снимаемых метрик
оценка полноты и качества алертов в системе
анализ процессов работы с алертами
Аудит системы резервирования и резервного копирования
анализ надежности и полноты схемы резервирования
анализ надежности и полноты схемы резервного копирования
оценка валидности текущих резервных копий
оценка соответствия систем резервирования и резервного копирования требованиям RTO и RPO на проекте
Анализ масштабируемости
оценка готовности элементов проекта к масштабированию при потенциальном росте нагрузки
Анализ документации (при наличии)
оценка полноты и актуальности документации по проекту
оценка применимости текущих инструкций на проекте
анализ процессов работы с документацией
Базовый чек-лист ИБ
доступность сервисов системы извне
доступность сервисов с дефолтными настройками авторизации
базовая проверка на наличие вредоносного ПО
наличие необходимых обновлений безопасности
набор данных для журналирования
доступности информации о системе извне
По завершении аудита вы получите подробный отчёт с рекомендациями по исправлению проблем в ключевых системах проекта.