Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Managed Service for Kubernetes
  • Сопоставление с другими сервисами Yandex Cloud
  • Начало работы
    • Все инструкции
    • Подключение к узлу по SSH
    • Подключение к узлу через OS Login
    • Обновление Kubernetes
    • Настройка автомасштабирования
    • Подключение Terraform-провайдера Kubernetes
    • Установка приложений из Yandex Cloud Marketplace с помощью Terraform
      • Основы работы с Cloud Marketplace
      • Установка Argo CD
      • Установка Chaos Mesh
      • Установка cert-manager c плагином Cloud DNS ACME webhook
      • Установка Container Storage Interface для S3
      • Установка Crossplane
      • Установка External Secrets Operator
      • Установка ExternalDNS c плагином для Cloud DNS
      • Установка Falco
      • Установка Filebeat OSS
      • Установка Fluent Bit
      • Установка Gatekeeper
      • Установка Gateway API
      • Установка GitLab Agent
      • Установка GitLab Runner
      • Установка Gwin
      • Установка HashiCorp Vault
      • Установка Ingress NGINX
      • Установка Ingress-контроллера Application Load Balancer
      • Обновление Ingress-контроллера Application Load Balancer
      • Установка Istio
      • Установка Jaeger
      • Установка KEDA
      • Установка Kruise
      • Установка Kubernetes Node Remediation
      • Установка Kyverno & Kyverno Policies
      • Установка Loki
      • Установка Metrics Provider
      • Установка NodeLocal DNS
      • Установка OIDC Аутентификация
      • Установка Policy Reporter
      • Установка Prometheus Operator
      • Установка Thumbor
      • Установка Velero
      • Установка VictoriaLogs
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Обучающие курсы

В этой статье:

  • Перед началом работы
  • Установка с помощью Yandex Cloud Marketplace
  • Установка с помощью Helm-чарта
  • Создание ресурса NodeHealthCheck
  1. Пошаговые инструкции
  2. Установка приложений из Cloud Marketplace
  3. Установка Kubernetes Node Remediation

Установка Kubernetes Node Remediation

Статья создана
Yandex Cloud
Улучшена
mmerihsesh
Обновлена 14 ноября 2025 г.
  • Перед началом работы
  • Установка с помощью Yandex Cloud Marketplace
  • Установка с помощью Helm-чарта
  • Создание ресурса NodeHealthCheck

Kubernetes Node Remediation — это набор операторов Kubernetes, которые обеспечивают автоматическое восстановление неисправных узлов кластера Managed Service for Kubernetes и высокую доступность для stateful-нагрузок.

Решение состоит из двух контроллеров:

  • Node Healthcheck Controller — отслеживает сбои.
  • Self Node Remediation Controller — переносит нагрузку с неисправных узлов и восстанавливает их.

Перед началом работыПеред началом работы

  1. Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

    По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

  2. Убедитесь, что группы безопасности для кластера Managed Service for Kubernetes и его групп узлов настроены корректно. Если отсутствует какое-либо из правил — добавьте его.

    Важно

    От настройки групп безопасности зависит работоспособность и доступность кластера, а также запущенных в нем сервисов и приложений.

  3. Установите kubectl и настройте его на работу с созданным кластером.

Установка с помощью Yandex Cloud MarketplaceУстановка с помощью Yandex Cloud Marketplace

  1. Перейдите на страницу каталога и выберите сервис Managed Service for Kubernetes.
  2. Нажмите на имя нужного кластера и выберите вкладку Marketplace.
  3. В разделе Доступные для установки приложения выберите Kubernetes Node Remediation и нажмите кнопку Перейти к установке.
  4. Задайте настройки приложения:
    • Пространство имен — создайте новое пространство имен (например, remediation-space). Если вы оставите пространство имен по умолчанию, Kubernetes Node Remediation может работать некорректно.
    • Название приложения — укажите название приложения.
  5. Нажмите кнопку Установить.
  6. Дождитесь перехода приложения в статус Deployed.
  7. Создайте ресурс NodeHealthCheck.

Установка с помощью Helm-чартаУстановка с помощью Helm-чарта

  1. Установите менеджер пакетов Helm версии не ниже 3.8.0.

  2. Для установки Helm-чарта с Kubernetes Node Remediation выполните команду:

    helm pull oci://cr.yandex/yc-marketplace/yandex-cloud/medik8s/kubernetes-node-remediation/chart/kubernetes-node-remediation \
      --version 1.0.1 \
      --untar && \
    helm install \
      --namespace <пространство_имен> \
      --create-namespace \
    kubernetes-node-remediation ./kubernetes-node-remediation/
    

    Если вы укажете в параметре namespace пространство имен по умолчанию, Kubernetes Node Remediation может работать некорректно. Рекомендуем указывать значение, отличное от всех существующих пространств имен (например, remediation-space).

    Примечание

    Если вы используете версию Helm ниже 3.8.0, добавьте в начало команды строку export HELM_EXPERIMENTAL_OCI=1 && \, чтобы включить поддержку Open Container Initiative (OCI) в клиенте Helm.

  3. Создайте ресурс NodeHealthCheck.

Создание ресурса NodeHealthCheckСоздание ресурса NodeHealthCheck

  1. Создайте файл с описанием ресурса NodeHealthCheck:

    apiVersion: remediation.medik8s.io/v1alpha1
    kind: NodeHealthCheck
    metadata:
      name: nodehc-sample
    spec:
      minHealthy: 51%
      remediationTemplate:
        apiVersion: self-node-remediation.medik8s.io/v1alpha1
        kind: SelfNodeRemediationTemplate
        name: self-node-remediation-automatic-strategy-template
        namespace: <пространство_имен_приложения>
      selector:
        matchLabels:
          beta.kubernetes.io/os: linux
      unhealthyConditions:
      - duration: 60s
        status: "False"
        type: Ready
      - duration: 60s
        status: Unknown
        type: Ready
    

    Где:

    • spec.minHealthy — минимальный процент здоровых узлов, при котором разрешено начинать восстановление.

    • spec.unhealthyConditions — список условий для статуса узла, по которым контроллер определяет, что узел неисправен.

      • duration — время, в течение которого условие должно сохраняться, прежде чем начнется процесс восстановления узла.
      • type — тип условия.
      • status — ожидаемый статус для признания узла неисправным.

      В приведенном примере контроллер NodeHealthCheck начнет восстановление, если тип условия Ready для узла в течение 60 секунд указывает на его недоступность или нерабочее состояние.

    Подробнее о полях ресурса.

  2. Перейдите в директорию с файлом и выполните команду:

    kubectl apply -f <имя_файла>
    

Была ли статья полезна?

Предыдущая
Установка Kruise
Следующая
Установка Kyverno & Kyverno Policies
Проект Яндекса
© 2025 ООО «Яндекс.Облако»