Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Data Processing
  • Начало работы
    • Все инструкции
      • Управление подкластерами
      • Изменение подкластера
    • Подготовка и использование виртуальных окружений Python
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • Вопросы и ответы
  • Обучающие курсы

В этой статье:

  • Изменить количество хостов
  • Изменить класс хостов
  • Изменить правило автомасштабирования подкластеров для обработки данных
  • Увеличить размер хранилища
  • Изменить группы безопасности
  1. Пошаговые инструкции
  2. Подкластеры Yandex Data Processing
  3. Изменение подкластера

Изменение подкластера

Статья создана
Yandex Cloud
Улучшена
mmerihsesh
Обновлена 21 апреля 2025 г.
  • Изменить количество хостов
  • Изменить класс хостов
  • Изменить правило автомасштабирования подкластеров для обработки данных
  • Увеличить размер хранилища
  • Изменить группы безопасности

Для каждого созданного подкластера вы можете:

  • Изменить количество хостов.
  • Изменить класс хостов.
  • Изменить правило автомасштабирования подкластеров для обработки данных.
  • Увеличить размер хранилища.
  • Изменить группы безопасности.

У подкластеров также можно изменить зону доступности. В этом случае они переносятся в другую зону доступности вместе с кластером Yandex Data Processing. Процесс зависит от типа кластера:

  • Миграция легковесного кластера в другую зону доступности.
  • Миграция кластера с файловой системой HDFS в другую зону доступности.

Изменить количество хостовИзменить количество хостов

Вы можете изменить количество хостов в подкластерах для хранения и обработки данных:

Консоль управления
CLI
Terraform
  1. Перейдите на страницу каталога и выберите сервис Yandex Data Processing.
  2. Нажмите на имя нужного кластера и выберите вкладку Подкластеры.
  3. Нажмите на значок для нужного подкластера и выберите пункт Редактировать.
  4. Введите или выберите нужное количество хостов в поле Хосты.
  5. (Опционально) Укажите таймаут декомиссии.
  6. Нажмите кнопку Сохранить изменения.

Yandex Data Processing запустит операцию добавления хостов.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

Чтобы изменить количество хостов для подкластера:

  1. Посмотрите описание команды CLI для изменения подкластера:

    yc dataproc subcluster update --help
    
  2. Укажите новое количество хостов в команде изменения подкластера:

    yc dataproc subcluster update <имя_или_идентификатор_подкластера> \
       --cluster-name=<имя_кластера> \
       --hosts-count=<количество_хостов>
    

    Идентификатор и имя подкластера можно получить со списком подкластеров в кластере, имя кластера — со списком кластеров в каталоге.

  1. Откройте актуальный конфигурационный файл Terraform с планом инфраструктуры.

    О том, как создать такой файл, см. в разделе Создание кластера.

  2. Измените в описании кластера Yandex Data Processing значение параметра hosts_count в блоке subcluster_spec соответствующего подкластера для хранения или обработки данных:

    resource "yandex_dataproc_cluster" "data_cluster" {
      ...
      cluster_config {
        ...
        subcluster_spec {
          name        = "<имя_подкластера>"
          ...
          hosts_count = <число_хостов_в_подкластере>
        }
      }
    }
    

Изменить класс хостовИзменить класс хостов

Важно

Изменение свойств хостов через интерфейсы Yandex Compute Cloud может привести к его неработоспособности. Чтобы изменить параметры хостов кластера, воспользуйтесь интерфейсами сервиса Yandex Data Processing: консолью управления, CLI, Terraform или API.

Вы можете изменить вычислительную мощность хостов в отдельном подкластере. Она зависит от режима размещения драйвера:

  • При режиме deployMode=cluster, когда драйвер размещается на одном из вычислительных хостов кластера (compute), подкластеру с хостом-мастером (master) достаточно 4–8 ядер CPU и 16 ГБ оперативной памяти.
  • При режиме deployMode=client, когда драйвер размещается на хосте-мастере кластера, вычислительная мощность зависит от логики заданий и количества запущенных конкурентных заданий.

Подробнее о режимах размещения драйвера и потреблении вычислительной мощности см. в разделе Распределение ресурсов.

Консоль управления
CLI
Terraform

Чтобы изменить класс хостов для подкластера:

  1. В консоли управления выберите каталог с кластером, в котором нужно изменить подкластер.
  2. Выберите сервис Yandex Data Processing и выберите нужный кластер.
  3. Перейдите в раздел Подкластеры.
  4. Нажмите на значок для нужного подкластера и выберите пункт Редактировать.
  5. Выберите нужную платформу и конфигурацию в блоке Класс хоста.
  6. Укажите опциональный таймаут декомиссии.
  7. Нажмите кнопку Сохранить изменения.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

Чтобы изменить класс хостов для подкластера:

  1. Посмотрите описание команды CLI для изменения подкластера:

    yc dataproc subcluster update --help
    
  2. Запросите список доступных классов хостов (в колонке ZONE IDS указаны зоны доступности, в которых можно выбрать соответствующий класс):

    yc dataproc resource-preset list
    

    Результат:

    +-----------+--------------------------------+-------+----------+
    |    ID     |            ZONE IDS            | CORES |  MEMORY  |
    +-----------+--------------------------------+-------+----------+
    | b3-c1-m4  | ru-central1-a, ru-central1-b,  |     2 | 4.0 GB   |
    |           | ru-central1-с                  |       |          |
    | ...                                                           |
    +-----------+--------------------------------+-------+----------+
    
  3. Укажите нужный класс в команде изменения подкластера:

    yc dataproc subcluster update <имя_или_идентификатор_подкластера> \
       --cluster-name=<имя_кластера> \
       --resource-preset=<класса_хоста>
    

    Идентификатор и имя подкластера можно получить со списком подкластеров в кластере, имя кластера — со списком кластеров в каталоге.

  1. Откройте актуальный конфигурационный файл Terraform с планом инфраструктуры.

    О том, как создать такой файл, см. в разделе Создание кластера.

  2. Измените в описании кластера Yandex Data Processing значение параметра resource_preset_id в блоке subcluster_spec.resources соответствующего подкластера:

    resource "yandex_dataproc_cluster" data_cluster {
      ...
      cluster_config {
        ...
        subcluster_spec {
          name = "<имя_подкластера>"
          ...
          resources {
            resource_preset_id = "<класс_хостов_подкластера>"
          ...
        }
      }
    }
    
  3. Проверьте корректность настроек.

    1. В командной строке перейдите в каталог, в котором расположены актуальные конфигурационные файлы Terraform с планом инфраструктуры.

    2. Выполните команду:

      terraform validate
      

      Если в файлах конфигурации есть ошибки, Terraform на них укажет.

  4. Подтвердите изменение ресурсов.

    1. Выполните команду для просмотра планируемых изменений:

      terraform plan
      

      Если конфигурации ресурсов описаны верно, в терминале отобразится список изменяемых ресурсов и их параметров. Это проверочный этап: ресурсы не будут изменены.

    2. Если вас устраивают планируемые изменения, внесите их:

      1. Выполните команду:

        terraform apply
        
      2. Подтвердите изменение ресурсов.

      3. Дождитесь завершения операции.

Более подробную информацию о ресурсах, которые вы можете создать с помощью Terraform, см. в документации провайдера.

Yandex Data Processing запустит операцию изменения подкластера. При этом все хосты изменяемого подкластера будут перезапущены.

Изменить правило автомасштабирования подкластеров для обработки данныхИзменить правило автомасштабирования подкластеров для обработки данных

Вы можете настроить правило автомасштабирования в подкластерах для обработки данных.

Проверьте, что в облаке хватает квоты на увеличение ресурсов виртуальных машин. Откройте страницу Квоты для вашего облака и проверьте, что в секции Compute Cloud не исчерпано место в строках:

  • Общий объём HDD-дисков;
  • Общий объём SSD-дисков;
  • Количество дисков;
  • Количество vCPU виртуальных машин;
  • Количество виртуальных машин.

Для работы автоматического масштабирования назначьте сервисному аккаунту кластера Yandex Data Processing роли:

  • dataproc.agent — чтобы сервисный аккаунт мог получать информацию о состоянии хостов кластера, заданиях и лог-группах.
  • dataproc.provisioner — чтобы сервисный аккаунт мог взаимодействовать с автоматически масштабируемой группой ВМ. Тогда будет доступно автомасштабирование подкластеров.
Консоль управления
CLI
Terraform

Чтобы настроить автомасштабирование для подкластеров:

  1. Перейдите на страницу каталога и выберите сервис Yandex Data Processing.
  2. Выберите кластер и перейдите на вкладку Подкластеры.
  3. Нажмите на значок для нужного подкластера и выберите пункт Редактировать.
  4. В блоке Масштабирование включите настройку Автоматическое масштабирование, если она выключена.
  5. Укажите параметры автоматического масштабирования.
  6. По умолчанию в качестве метрики для автоматического масштабирования используется yarn.cluster.containersPending. Чтобы включить масштабирование на основе загрузки CPU, выключите настройку Масштабирование по умолчанию и укажите целевой уровень загрузки CPU.
  7. Нажмите кнопку Сохранить изменения.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

Чтобы настроить автомасштабирование для подкластеров:

  1. Посмотрите описание команды CLI для изменения подкластера:

    yc dataproc subcluster update --help
    
  2. Укажите параметры автомасштабирования в команде изменения подкластера:

    yc dataproc subcluster update <имя_или_идентификатор_подкластера> \
       --cluster-name=<имя_кластера> \
       --hosts-count=<минимальное_количество_хостов> \
       --max-hosts-count=<максимальное_количество_хостов> \
       --enable-preemptible=<использование_прерываемых_ВМ> \
       --warmup-duration=<время_на_разогрев_ВМ> \
       --stabilization-duration=<период_стабилизации> \
       --measurement-duration=<промежуток_измерения_нагрузки> \
       --cpu-utilization-target=<целевой_уровень_загрузки_CPU> \
       --autoscaling-decommission-timeout=<таймаут_декомиссии>
    

    Где:

    • --hosts-count — минимальное количество хостов (виртуальных машин) в подкластере. Минимальное значение — 1, максимальное — 32.
    • --max-hosts-count — максимальное количество хостов (виртуальных машин) в подкластере. Минимальное значение — 1, максимальное — 100.
    • --enable-preemptible — использование прерываемых ВМ. Может принимать значения true или false.
    • --warmup-duration — время в секундах на разогрев ВМ, в формате <значение>s. Минимальное значение — 0s, максимальное — 600s (10 минут).
    • --stabilization-duration — период в секундах, в течение которого требуемое количество ВМ не может быть снижено, в формате <значение>s. Минимальное значение — 60s (1 минута), максимальное — 1800s (30 минут).
    • --measurement-duration — период в секундах, за который замеры нагрузки усредняются для каждой ВМ, в формате <значение>s. Минимальное значение — 60s (1 минута), максимальное — 600s (10 минут).
    • --cpu-utilization-target — целевой уровень загрузки CPU, в процентах. Используйте эту настройку, чтобы включить масштабирование на основе загрузки CPU, иначе в качестве метрики будет использоваться yarn.cluster.containersPending (на основе количества ожидающих задания ресурсов). Минимальное значение — 10, максимальное — 100.
    • --autoscaling-decommission-timeout — таймаут декомиссии в секундах. Минимальное значение — 0, максимальное — 86400 (сутки).

    Идентификатор и имя подкластера можно получить со списком подкластеров в кластере, имя кластера — со списком кластеров в каталоге.

Чтобы настроить автомасштабирование для подкластеров:

  1. Откройте актуальный конфигурационный файл Terraform с планом инфраструктуры.

    О том, как создать такой файл, см. в разделе Создание кластера.

  2. Добавьте в описании кластера Yandex Data Processing блок subcluster_spec.autoscaling_config с нужными вам параметрами автоматического масштабирования для соответствующего подкластера :

    resource "yandex_dataproc_cluster" "data_cluster" {
      ...
      cluster_config {
        ...
        subcluster_spec {
          name = "<имя_подкластера>"
          role = "COMPUTENODE"
          ...
          autoscaling_config {
          max_hosts_count        = <максимальное_количество_ВМ_в_группе>
          measurement_duration   = <промежуток_измерения_нагрузки>
          warmup_duration        = <время_на_разогрев>
          stabilization_duration = <период_стабилизации>
          preemptible            = <использование_прерываемых_ВМ>
          cpu_utilization_target = <целевой_уровень_загрузки_vCPU>
          decommission_timeout   = <таймаут_декомиссии>
        }
      }
    

    Где:

    • max_hosts_count — максимальное количество хостов (виртуальных машин) в подкластере. Минимальное значение — 1, максимальное — 100.
    • measurement_duration — период в секундах, за который замеры нагрузки усредняются для каждой ВМ, в формате <значение>s. Минимальное значение — 60s (1 минута), максимальное — 600s (10 минут).
    • warmup_duration — время в секундах на разогрев ВМ, в формате <значение>s. Минимальное значение — 0s, максимальное — 600s (10 минут).
    • stabilization_duration — период в секундах, в течение которого требуемое количество ВМ не может быть снижено, в формате <значение>s. Минимальное значение — 60s (1 минута), максимальное — 1800s (30 минут).
    • preemptible — использование прерываемых ВМ. Может принимать значения true или false.
    • cpu_utilization_target — целевой уровень загрузки CPU, в процентах. Используйте эту настройку, чтобы включить масштабирование на основе загрузки CPU, иначе в качестве метрики будет использоваться yarn.cluster.containersPending (на основе количества ожидающих задания ресурсов). Минимальное значение — 10, максимальное — 100.
    • decommission_timeout — таймаут декомиссии в секундах. Минимальное значение — 0, максимальное — 86400 (сутки).
  3. Проверьте корректность настроек.

    1. В командной строке перейдите в каталог, в котором расположены актуальные конфигурационные файлы Terraform с планом инфраструктуры.

    2. Выполните команду:

      terraform validate
      

      Если в файлах конфигурации есть ошибки, Terraform на них укажет.

  4. Подтвердите изменение ресурсов.

    1. Выполните команду для просмотра планируемых изменений:

      terraform plan
      

      Если конфигурации ресурсов описаны верно, в терминале отобразится список изменяемых ресурсов и их параметров. Это проверочный этап: ресурсы не будут изменены.

    2. Если вас устраивают планируемые изменения, внесите их:

      1. Выполните команду:

        terraform apply
        
      2. Подтвердите изменение ресурсов.

      3. Дождитесь завершения операции.

Более подробную информацию о ресурсах, которые вы можете создать с помощью Terraform, см. в документации провайдера.

Увеличить размер хранилищаУвеличить размер хранилища

Важно

Изменение свойств хостов через интерфейсы Yandex Compute Cloud может привести к его неработоспособности. Чтобы изменить параметры хостов кластера, воспользуйтесь интерфейсами сервиса Yandex Data Processing: консолью управления, CLI, Terraform или API.

Вы можете увеличить размер хранилища, доступного каждому хосту в определенном подкластере.

Примечание

Уменьшить размер хранилища на данный момент невозможно. Если это необходимо, пересоздайте подкластер Yandex Data Processing.

Проверьте, что в облаке хватает квоты на увеличение ресурсов виртуальных машин. Откройте страницу Квоты для вашего облака и проверьте, что в секции Compute Cloud не исчерпано место в строках:

  • Общий объём HDD-дисков;
  • Общий объём SSD-дисков;
  • Количество дисков.
Консоль управления
CLI
Terraform

Чтобы изменить размер хранилища для подкластера:

  1. В консоли управления выберите каталог с кластером, в котором нужно изменить подкластер.
  2. Выберите сервис Yandex Data Processing и выберите нужный кластер.
  3. Перейдите в раздел Подкластеры.
  4. Нажмите на значок для нужного подкластера и выберите пункт Редактировать.
  5. Введите или выберите нужный объем хранилища в блоке Размер хранилища.
  6. Нажмите кнопку Сохранить изменения.

Yandex Data Processing запустит операцию изменения подкластера.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

Чтобы изменить размер хранилища для подкластера:

  1. Посмотрите описание команды CLI для изменения подкластера:

    yc dataproc subcluster update --help
    
  2. Укажите нужный объем хранилища в команде изменения подкластера:

    yc dataproc subcluster update <имя_или_идентификатор_подкластера> \
       --cluster-name=<имя_кластера> \
       --disk-size=<размер_хранилища_ГБ>
    

    Идентификатор и имя подкластера можно получить со списком подкластеров в кластере, имя кластера — со списком кластеров в каталоге.

Если все условия выполнены, Yandex Data Processing запустит операцию по увеличению объема хранилища.

Чтобы увеличить размер хранилища для подкластера:

  1. Откройте актуальный конфигурационный файл Terraform с планом инфраструктуры.

    О том, как создать такой файл, см. в разделе Создание кластера.

  2. Измените в описании кластера Yandex Data Processing значение параметра disk_size в блоке subcluster_spec.resources соответствующего подкластера:

    resource "yandex_dataproc_cluster" "data_cluster" {
      ...
      cluster_config {
        ...
        subcluster_spec {
          name = "<имя_подкластера>"
          ...
          resources {
            disk_size = <объем_хранилища_ГБ>
            ...
          }
        }
      }
    }
    
  3. Проверьте корректность настроек.

    1. В командной строке перейдите в каталог, в котором расположены актуальные конфигурационные файлы Terraform с планом инфраструктуры.

    2. Выполните команду:

      terraform validate
      

      Если в файлах конфигурации есть ошибки, Terraform на них укажет.

  4. Подтвердите изменение ресурсов.

    1. Выполните команду для просмотра планируемых изменений:

      terraform plan
      

      Если конфигурации ресурсов описаны верно, в терминале отобразится список изменяемых ресурсов и их параметров. Это проверочный этап: ресурсы не будут изменены.

    2. Если вас устраивают планируемые изменения, внесите их:

      1. Выполните команду:

        terraform apply
        
      2. Подтвердите изменение ресурсов.

      3. Дождитесь завершения операции.

Более подробную информацию о ресурсах, которые вы можете создать с помощью Terraform, см. в документации провайдера.

Изменить группы безопасностиИзменить группы безопасности

Консоль управления
Terraform
  1. Перейдите на страницу каталога и выберите сервис Yandex Data Processing.
  2. Нажмите на имя нужного кластера и выберите вкладку Хосты.
  3. Нажмите на имя нужного хоста.
  4. В блоке Сеть нажмите на значок и выберите Изменить.
  5. Выберите нужные группы безопасности.
  6. Нажмите кнопку Сохранить.
  1. Откройте актуальный конфигурационный файл Terraform с планом инфраструктуры.

    О том, как создать такой файл, см. в разделе Создание кластера.

  2. Измените значение параметра security_group_ids в описании кластера:

    resource "yandex_dataproc_cluster" "data_cluster" {
      ...
      security_group_ids = [ "<список_идентификаторов_групп_безопасности_кластера>" ]
    }
    
  3. Проверьте корректность настроек.

    1. В командной строке перейдите в каталог, в котором расположены актуальные конфигурационные файлы Terraform с планом инфраструктуры.

    2. Выполните команду:

      terraform validate
      

      Если в файлах конфигурации есть ошибки, Terraform на них укажет.

  4. Подтвердите изменение ресурсов.

    1. Выполните команду для просмотра планируемых изменений:

      terraform plan
      

      Если конфигурации ресурсов описаны верно, в терминале отобразится список изменяемых ресурсов и их параметров. Это проверочный этап: ресурсы не будут изменены.

    2. Если вас устраивают планируемые изменения, внесите их:

      1. Выполните команду:

        terraform apply
        
      2. Подтвердите изменение ресурсов.

      3. Дождитесь завершения операции.

Более подробную информацию о ресурсах, которые вы можете создать с помощью Terraform, см. в документации провайдера.

Важно

Может потребоваться дополнительная настройка групп безопасности для подключения к кластеру.

Была ли статья полезна?

Предыдущая
Управление подкластерами
Следующая
Подключение к интерфейсам компонентов
Проект Яндекса
© 2025 ООО «Яндекс.Облако»