Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Managed Service for Kubernetes
  • Сопоставление с другими сервисами Yandex Cloud
  • Начало работы
    • Взаимосвязь ресурсов сервиса
    • Релизные каналы и обновления
    • Шифрование
    • Сеть в Managed Service for Kubernetes
    • Сетевые настройки и политики кластера
    • Автоматическое масштабирование
    • Политика аудита
    • Внешние узлы кластера
    • Квоты и лимиты
    • Рекомендации по использованию Managed Service for Kubernetes
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Обучающие курсы

В этой статье:

  • Автоматическое масштабирование кластера
  • Горизонтальное автомасштабирование подов
  • Вертикальное автомасштабирование подов
  • Примеры использования
  1. Концепции
  2. Автоматическое масштабирование

Автоматическое масштабирование

Статья создана
Yandex Cloud
Обновлена 16 апреля 2025 г.
  • Автоматическое масштабирование кластера
  • Горизонтальное автомасштабирование подов
  • Вертикальное автомасштабирование подов
  • Примеры использования

Автоматическое масштабирование — это изменение размера группы узлов, количества подов или количества выделяемых каждому поду ресурсов на основе запросов ресурсов для подов, запущенных на узлах этой группы. Автоматическое масштабирование доступно в Kubernetes с версии 1.15.

В кластере Managed Service for Kubernetes доступны три вида автоматического масштабирования:

  • Автоматическое масштабирование кластера (Cluster Autoscaler). Managed Service for Kubernetes отслеживает нагрузку на узлы и при необходимости изменяет их количество в указанных пределах.
  • Горизонтальное масштабирование подов (Horizontal Pod Autoscaler). Kubernetes динамически изменяет количество подов, запущенных на каждом узле группы.
  • Вертикальное масштабирование подов (Vertical Pod Autoscaler). При повышении нагрузки Kubernetes выделяет каждому поду дополнительные ресурсы в установленных пределах.

Вы можете использовать несколько видов автоматического масштабирования в одном кластере. При этом не рекомендуется использовать Horizontal Pod Autoscaler и Vertical Pod Autoscaler одновременно.

Автоматическое масштабирование кластераАвтоматическое масштабирование кластера

Cluster Autoscaler автоматически изменяет количество узлов в группе в зависимости от нагрузки.

Важно

Размещение узлов автомасштабируемой группы возможно только в одной зоне доступности.

При создании группы узлов выберите автоматический тип масштабирования и задайте минимальное, максимальное и начальное количество узлов в группе. Kubernetes будет периодически проверять состояние подов и нагрузку на узлы, при необходимости изменяя размер группы:

  • Если поды не могут быть назначены из-за нехватки vCPU или RAM на существующих узлах, число узлов в группе будет постепенно увеличиваться до указанного максимального размера.
  • Если нагрузка на узлы недостаточная и все поды могут быть назначены с меньшим количеством узлов в группе, число узлов в группе будет постепенно уменьшаться до указанного минимального размера. Если поды узла не могут быть расселены за установленное время (5 минут), узел принудительно останавливается. Время ожидания нельзя изменить.

Примечание

При подсчете текущих лимитов и квот сервис Managed Service for Kubernetes учитывает указанный максимальный размер группы узлов как фактический, независимо от текущего размера группы.

Включение Cluster Autoscaler доступно только при создании группы узлов. Управление Cluster Autoscaler выполняется на стороне сервиса Managed Service for Kubernetes.

Подробнее см. в документации Kubernetes:

  • описание Cluster Autoscaler;
  • параметры, используемые по умолчанию;

См. также раздел Вопросы и ответы про автоматическое масштабирование группы узлов в Managed Service for Kubernetes.

Горизонтальное автомасштабирование подовГоризонтальное автомасштабирование подов

При использовании горизонтального масштабирования подов Kubernetes изменяет их количество в зависимости от степени нагрузки на vCPU.

При создании Horizontal Pod Autoscaler укажите в параметрах:

  • Желаемую среднюю нагрузку на vCPU для каждого пода в процентах.
  • Минимальное и максимальное количество реплик подов.

Горизонтальное автомасштабирование подов доступно для контроллеров:

  • Deployment.
  • StatefulSet.
  • ReplicaSet.

Подробнее о Horizontal Pod Autoscaler см. в документации Kubernetes.

Вертикальное автомасштабирование подовВертикальное автомасштабирование подов

Kubernetes ограничивает выделение ресурсов для каждого приложения с помощью параметров limits. Для пода, превысившего лимит vCPU, включается режим пропуска тактов процессора. Под, превысивший лимит RAM, будет остановлен.

Vertical Pod Autoscaler при необходимости выделяет дополнительные ресурсы vCPU и RAM для подов.

При создании Vertical Pod Autoscaler укажите в спецификации опцию автоматического масштабирования:

  • updateMode: "Auto", чтобы Vertical Pod Autoscaler автоматически управлял ресурсами подов.
  • updateMode: "Off", чтобы Vertical Pod Autoscaler предоставлял рекомендации по управлению ресурсами подов, но не изменял их.

Подробнее о Vertical Pod Autoscaler см. в документации Kubernetes.

Примеры использованияПримеры использования

  • Горизонтальное масштабирование приложения в кластере
  • Вертикальное масштабирование приложения в кластере
  • Развертывание и нагрузочное тестирование gRPC-сервиса с масштабированием
  • Создание веб-хука резолвера ACME для ответов на DNS01-проверки

Была ли статья полезна?

Предыдущая
Сетевые настройки и политики кластера
Следующая
Политика аудита
Проект Яндекса
© 2025 ООО «Яндекс.Облако»