Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Compute Cloud
  • Yandex Container Solution
    • Взаимосвязь ресурсов
    • Графические ускорители GPU
    • Образы
      • Обзор
      • Доступ
      • YAML-спецификация
      • Шаблон виртуальной машины
      • Переменные в шаблоне виртуальной машины
        • Обзор
        • Политика распределения
        • Политика развертывания
        • Политика масштабирования
        • Политика восстановления
      • Типы масштабирования
      • Проверки и автовосстановление ВМ
      • Интеграция с сетевыми и L7-балансировщиками
      • Работа со Stateful-нагрузкой
      • Остановка группы и приостановка процессов
      • Поочередные перезагрузка и пересоздание ВМ в группе
      • Статусы
    • Выделенный хост
    • Шифрование
    • Резервное копирование
    • Квоты и лимиты
  • Управление доступом
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Обучающие курсы

В этой статье:

  • fixed_scale
  • auto_scale
  • test_auto_scale
  • Примеры использования
  1. Концепции
  2. Группы виртуальных машин
  3. Политики
  4. Политика масштабирования

Политика масштабирования

Статья создана
Yandex Cloud
Обновлена 31 марта 2025 г.
  • fixed_scale
  • auto_scale
  • test_auto_scale
  • Примеры использования

При создании группы виртуальных машин можно выбрать каким образом увеличивать и уменьшать число ВМ в группе.

Политика определяется в YAML-файле, в ключе scale_policy.

fixed_scalefixed_scale

Ключ fixed_scale определяет группу ВМ фиксированного размера. Размер группы определяется в ключе size. Вы можете создать группу с необходимым вам количеством ВМ в рамках доступных квот и лимитов.

Пример записи в YAML-файле:

...
scale_policy:
  fixed_scale:
    size: 3
...

Где:

Ключ Значение
fixed_scale Группа ВМ фиксированного размера.
size* Количество ВМ в группе.
Допустимые значения — от 0 до 100.

* Обязательное поле.

auto_scaleauto_scale

Ключ auto_scale определяет автоматически масштабируемую группу ВМ. Начальный размер группы определяется в ключе initial_size. Вы можете создать группу с необходимым вам количеством ВМ в рамках доступных квот и лимитов.

Группа ВМ будет масштабироваться по значениям указанных метрик: нагрузке CPU (ключ cpu_utilization_rule) и/или метрикам из сервиса Yandex Monitoring. Если в файле указано несколько метрик, то в качестве размера группы ВМ используется наибольший из вычисленных по метрикам.

Пример записи в YAML-файле:

scale_policy:
  auto_scale:
    auto_scale_type: REGIONAL
    initial_size: 5
    max_size: 15
    min_zone_size: 3
    measurement_duration: 30s
    warmup_duration: 60s
    stabilization_duration: 120s
    cpu_utilization_rule:
      utilization_target: 75
    custom_rules:
    - rule_type: WORKLOAD
      metric_type: GAUGE
      metric_name: queue.messages.stored_count
      labels:
        queue: dj6000000002********
      target: 5

Где:

Ключ Значение
auto_scale Автоматически масштабируемая группа ВМ.
auto_scale_type Тип автоматического масштабирования.
Возможные значения:
  • ZONAL — зональное масштабирование: для каждой зоны доступности рассчитывается свое среднее значение метрики для масштабирования и нужное количество ВМ.
  • REGIONAL — региональное масштабирование: метрика и количество ВМ рассчитываются для всей группы.
Значение по умолчанию: ZONAL.
initial_size* Начальное количество ВМ в группе.
Допустимые значения — от 1 до 100.
max_size Максимальное количество ВМ в группе.
Допустимые значения — от 0 до 100.
min_zone_size Минимальное количество ВМ в одной зоне доступности.
Допустимые значения — от 0 до 100.
measurement_duration Промежуток измерения нагрузки: значение каждой метрики будет рассчитываться как среднее всех измерений, сделанных за указанный промежуток. Если это значение превысит целевое значение метрики для масштабирования, то Instance Groups увеличит количество ВМ в группе.
Допустимые значения — от 60 до 600 секунд. Значение по умолчанию — 60 секунд.
warmup_duration Время на разогрев ВМ. В течение этого времени после запуска на ВМ подается трафик, но значения метрик для этой ВМ не используются для масштабирования группы. Вместо них используются средние значения метрик в группе.
Допустимые значения — от 0 до 600 секунд. Значение по умолчанию — 0 секунд.
stabilization_duration Период стабилизации. После увеличения количества ВМ размер группы не уменьшается до окончания периода стабилизации, даже если среднее значение метрики для масштабирования стало ниже целевого уровня.
Допустимые значения — от 60 до 1800 секунд.
cpu_utilization_rule Задает целевой уровень нагрузки CPU, который позволяет выполнять масштабирование, основываясь на средней нагрузке CPU для группы ВМ.
utilization_target Целевой уровень нагрузки CPU, который должен поддерживать Instance Groups.
Если средний уровень нагрузки CPU ниже целевого значения, Instance Groups будет сокращать количество ВМ, пока не достигнет значения min_zone_size в каждой зоне доступности.
Если средний уровень нагрузки CPU выше целевого значения, Instance Groups будет создавать ВМ, пока не достигнет значения max_size.
Допустимые значения — от 10 до 100.
custom_rules Список метрик из сервиса Yandex Monitoring для автоматического масштабирования. Может включать до трех метрик.
rule_type Тип правил применения метрики:
  • UTILIZATION — для метрик, характеризующих потребление ресурсов одной ВМ;
  • WORKLOAD — для метрик, характеризующих суммарную нагрузку на все ВМ.
Подробнее см. в разделе Метрики мониторинга.
metric_type Тип метрики:
  • GAUGE — метрика отражает значение показателя в определенный момент времени;
  • COUNTER — метрика монотонно растет со временем.
Подробнее см. в разделе Метрики мониторинга.
metric_name Имя метрики из Monitoring.
labels Метки метрики из Monitoring.
target Целевое значение метрики, по которому Instance Groups рассчитывает нужное количество ВМ. Подробнее см. в разделе Метрики мониторинга.

* Обязательное поле.

test_auto_scaletest_auto_scale

Ключ test_auto_scale определяет группу ВМ фиксированного размера с возможностью тестирования автоматического масштабирования. На графиках вкладки Мониторинг отображается рекомендуемое увеличение или уменьшение числа ВМ в зависимости от значения выбранной метрики, при этом фактическое число машин всегда остается равным заданному в ключе size. Вы можете создать группу с необходимым вам количеством ВМ в рамках доступных квот и лимитов.

scale_policy:
  fixed_scale:
    size: 5
  test_auto_scale:
    initial_size: 5
    max_size: 15
    min_zone_size: 3
    measurement_duration: 30s
    warmup_duration: 60s
    stabilization_duration: 120s
    cpu_utilization_rule:
      utilization_target: 75

Для test_auto_scale используются такие же ключи, как и для auto_scale.

Примеры использованияПримеры использования

  • Работа с группой виртуальных машин с автоматическим масштабированием

См. такжеСм. также

  • Политика восстановления
  • Политика распределения
  • Политика развертывания

Была ли статья полезна?

Предыдущая
Политика развертывания
Следующая
Политика восстановления
Проект Яндекса
© 2025 ООО «Яндекс.Облако»