Динамическая миграция подключена автоматически у всех клиентов Yandex Cloud и проходит почти бесшовно. Но техподдержка всё равно сообщает клиентам о плановых и внеплановых технических работах, которые могут сопровождаться миграцией виртуальных машин, и подсказывает, как уменьшить влияние работ на ресурсы клиентов.
Есть несколько типов ВМ, которые невозможно переместить с помощью динамической миграции:
Поэтому работу таких ВМ приостанавливают на время обслуживания оборудования.
Пользователи сервиса Yandex Compute Cloud могут сами повысить отказоустойчивость своих ресурсов, если настроят Instance Groups. Этот компонент позволяет объединять однотипные виртуальные машины в группы и управлять ими. Говоря об отказоустойчивости, стоит упомянуть два типа проверок, которые можно провести, если настроить Instance Groups: это проверка состояния группы и приложений.
Она проводится, если клиент подключил сетевой балансировщик Yandex Network Load Balancer. Этот сервис проверяет доступность группы ВМ и равномерно распределяет входящий трафик между машинами. Интервалы проверок и пороги доступности настраивает пользователь.
В консоли управления Yandex Cloud будут отображаться следующие статусы:
- Группа ВМ работает исправно: готова принимать трафик, с ней можно производить любые действия — масштабировать, изменять настройки и т. д.
|
|
- Группа ВМ не работает или в ней происходят изменения, ограничивающие её работоспособность.
|
- PAUSED,
- STOPPING,
- STOPPED,
- DELETING и др.
|
У каждой ВМ в группе тоже есть свой собственный статус. Весь список можно посмотреть в документации.
Проверки позволяют выявлять сбои в работе ресурсов, с минимальным простоем создавать работающие копии ВМ и перенаправлять на них трафик. Поэтому настройка компонента Instance Groups — один из лучших способов повысить отказоустойчивость вашей облачной инфраструктуры. Специалисты технической поддержки Yandex Cloud всегда подскажут, что делать, и ответят на любые ваши вопросы об Instance Groups.
Она нужна, чтобы проверить работоспособность приложений, запущенных на ВМ в работающей группе (со статусом ACTIVE). По умолчанию опция проверки приложений выключена. Её можно подключить вручную в настройках Compute Cloud. Интервал между проверками, время ожидания ответа, количество проверок тоже устанавливают в настройках.
Есть два типа сетевых дисков: реплицируемые и нереплицируемые. Когда пользователь создаёт облачные диски, он может выбрать один из них. Дальше мы расскажем, как обеспечить отказоустойчивость каждого типа.
Для дисков этого типа система выделяет один физический носитель в одном из ЦОДов. При перебоях в его работе данные будут недоступны. Риск останется, даже если создать несколько таких дисков, и вот почему. Система автоматически распределяет их по физическому оборудованию в ЦОДе. Есть вероятность, что два или более диска окажутся в одной серверной стойке, чья работа может остановиться из‑за аварии или планового обслуживания.
Чтобы снизить риск того, что сразу несколько дисков выйдут из строя, мы рекомендуем объединять нереплицируемые диски в группы. Для этого используют компонент Placement Groups сервиса Compute Cloud. Создание групп не влияет на скорость операций, поскольку все компоненты группы размещаются в одной зоне доступности.
Если вам нужны дополнительные инструменты резервного копирования данных, воспользуйтесь сервисом Yandex Cloud Backup. С его помощью настраивается автоматическое резервное копирование виртуальных машин и дисков.
Реплицируемый диск — это диск, копии (реплики) которого могут храниться на разных физических носителях, образуя кластер. Если один носитель выйдет из строя, копии останутся на другом. Если для размещения файлов выбран реплицируемый диск, то основной способ обеспечить его безотказную работу — создавать снимки или образы.