Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Managed Service for ClickHouse®
  • Начало работы
    • Взаимосвязь ресурсов сервиса
    • Классы хостов
    • Сеть в Managed Service for ClickHouse®
    • Квоты и лимиты
    • Хранилище
    • Резервные копии
    • Репликация
    • Словари
    • Шардирование
    • Служебные пользователи
    • Техническое обслуживание
    • Поддерживаемые клиенты
    • Управление памятью
    • Политика работы с версиями ClickHouse®
    • Настройки ClickHouse®
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Yandex Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Особенности гибридного хранилища
  • Доступные политики хранения
  • Настройки гибридного хранилища
  • Выбор типа дисков при создании кластера
  • Шифрование диска
  • Управление дисковым пространством
  • Автоматическое увеличение размера хранилища
  • Примеры использования
  1. Концепции
  2. Хранилище

Хранилище в Managed Service for ClickHouse®

Статья создана
Yandex Cloud
Обновлена 7 октября 2025 г.
  • Особенности гибридного хранилища
    • Доступные политики хранения
    • Настройки гибридного хранилища
  • Выбор типа дисков при создании кластера
  • Шифрование диска
  • Управление дисковым пространством
    • Автоматическое увеличение размера хранилища
  • Примеры использования

Managed Service for ClickHouse® позволяет использовать сетевые и локальные диски для организации хранилища кластеров баз данных. Сетевые диски реализованы на базе сетевых блоков — виртуальных дисков в инфраструктуре Yandex Cloud. Локальные диски физически размещаются в серверах хостов БД.

При создании кластера вы можете выбрать для хранилища следующие типы дисков:

  • Сетевые HDD-диски (network-hdd) — самый экономичный вариант для кластеров, не требовательных к скорости записи и чтения.

  • Сетевые SSD-диски (network-ssd) — компромиссный вариант: медленнее, чем локальные SSD-диски, но, в отличие от них, обеспечивают сохранность данных при выходе из строя оборудования Yandex Cloud.

  • Нереплицируемые SSD-диски (network-ssd-nonreplicated) — сетевые диски с повышенной производительностью, реализованной за счет устранения избыточности.

    Объем такого хранилища можно увеличивать только с шагом 93 ГБ.

  • Сверхбыстрые сетевые SSD-диски с тремя репликами (network-ssd-io-m3) — сетевые диски с теми же скоростными характеристиками, что и нереплицируемые. Этот тип диска обеспечивает избыточность.

    Объем таких дисков можно увеличивать только с шагом 93 ГБ.

  • Локальные SSD-диски (local-ssd) — самые быстрые диски.

    Объем такого хранилища можно увеличивать:

    • для платформ Intel Broadwell и Intel Cascade Lake — только с шагом 100 ГБ;
    • для платформы Intel Ice Lake — только с шагом 368 ГБ.

    Для кластеров, хосты которых располагаются в зоне доступности ru-central1-d, недоступно хранилище на локальных SSD-дисках при использовании платформы Intel Cascade Lake.

Примечание

До 5% дискового пространства резервируется для служебных нужд, поэтому на дисках может быть меньше доступного места, чем заявлено при создании кластера.

Подробнее о размерах и производительности разных типов дисков см. в документации Yandex Compute Cloud.

Особенности гибридного хранилищаОсобенности гибридного хранилища

Если при создании или изменении кластера включить настройку Гибридное хранилище, появится возможность распределять данные между хранилищем кластера и объектным хранилищем Yandex Object Storage. Тогда данные будут размещаться либо в кластерном, либо в объектном хранилище в зависимости от заданной политики хранения. Например, часто используемые горячие данные размещаются в хранилище кластера, а редко используемые холодные данные — в более дешевом и медленном объектном хранилище.

Важно

Гибридное хранилище доступно для таблиц только на движке MergeTree. Данные таблиц на других движках хранятся только в кластерном хранилище.

В объектном хранилище используется служебный бакет с неограниченным объемом памяти. Класс такого хранилища — стандартный, изменить его нельзя. Для объектного хранилища применяются лимиты сервиса Object Storage.

Чтобы начать использовать гибридное хранилище:

  1. Создайте кластер нужного вида. Настройка объектного хранилища не требуется.

  2. Добавьте базы данных и таблицы в кластер. Если политика хранения по умолчанию не подходит для некоторых таблиц, задайте нужные политики для этих таблиц:

    • Чтобы указать политику при создании таблицы, задайте настройку storage_policy:

      CREATE TABLE table_with_non_default_policy (
          <схема_таблицы>
      ) ENGINE = MergeTree
      ...
      SETTINGS storage_policy = '<тип_политики_хранения>';
      
    • Чтобы задать или изменить политику для уже существующей таблицы, используйте запрос:

      ALTER TABLE table_with_non_default_policy
      MODIFY SETTING storage_policy = '<тип_политики_хранения>';
      

Пример см. в практическом руководстве Использование гибридного хранилища.

Чтобы отслеживать, какой объем занимают куски таблиц MergeTree в Yandex Object Storage, воспользуйтесь метрикой ch_s3_disk_parts_size в сервисе Yandex Monitoring. Она доступна только для кластеров Managed Service for ClickHouse® с настроенным гибридным хранилищем.

Хранение холодных данных и их резервных копий в гибридном хранилище учитывается при расчете стоимости использования кластера.

Доступные политики храненияДоступные политики хранения

Примечание

Создавать новые политики хранения или изменять уже существующие нельзя.

В кластере Managed Service for ClickHouse® с включенным гибридным хранилищем предустановлены следующие политики хранения:

  • default (по умолчанию) — кластер автоматически управляет размещением данных в зависимости от:

    • настроек гибридного хранилища;
    • настроек TTL для таблиц (время жизни).

    При достаточном объеме свободного места в кластерном хранилище, перемещение в объектное хранилище выполняется только для тех строк таблицы, для которых истекло значение TTL. Эта операция позволяет переместить часть данных в объектное хранилище, не дожидаясь заполнения кластерного хранилища.

    Настроить перемещение строк с истекшим сроком жизни в объектное хранилище и задать значение TTL можно при создании таблицы или позднее.

  • local — строки таблицы с такой политикой размещаются только в кластерном хранилище. Перемещения данных между хранилищами не происходит.

  • object_storage — строки таблицы с такой политикой размещаются только в объектном хранилище. Перемещения данных между хранилищами не происходит.

Политики хранения не оказывают влияния на операции слияния кусков данных. При любой политике хранения вы можете:

  • Включать и выключать настройку prefer_not_to_merge, которая выполняет слияние кусков данных в хранилищах. Настройка доступна в CLI и API.
  • Задавать любое значение настройке max_data_part_size_bytes, которая устанавливает максимальный размер итогового куска данных после слияния меньших кусков.

Однако можно влиять на поведение этих операций с помощью доступных в кластере настроек.

Посмотреть актуальные настройки политик можно с помощью запроса:

SELECT *
FROM system.storage_policies;

Подробнее о политиках хранения и их настройках см. в документации ClickHouse®.

Настройки гибридного хранилищаНастройки гибридного хранилища

В кластере Managed Service for ClickHouse® с включенным гибридным хранилищем доступны следующие настройки:

  • data_cache_enabled — разрешает временное хранение в кластерном хранилище данных, запрошенных из объектного хранилища. По умолчанию — true (разрешено).

    При таком подходе запрашиваемые из объектного хранилища холодные данные попадают на быстрые диски, где их обработка будет занимать меньше времени.

  • data_cache_max_size — определяет максимальный объем памяти (в байтах), выделяемый в кластерном хранилище для временного хранения данных, запрошенных из объектного хранилища. По умолчанию — 1073741824 (1 ГБ).

  • move_factor— устанавливает минимальную долю свободного места в кластерном хранилище. Если доля свободного места меньше этого значения, данные переносятся в Yandex Object Storage. Минимальное значение — 0, максимальное — 1, по умолчанию — 0.01.

    Куски данных для переноса выстраиваются в очередь от большего к меньшему, затем переносится такое количество кусков, при котором будет выполняться условие move_factor.

  • prefer_not_to_merge — отключает слияние кусков данных в кластерном и объектном хранилищах. По умолчанию слияние включено.

    После вставки данных в таблицу они сохраняются в виде куска данных и сортируются по первичному ключу. Затем в фоновом режиме куски одной партиции сливаются в более крупный кусок через 10–15 минут после вставки. Вы можете использовать системную таблицу system.parts, чтобы посмотреть слитые куски данных и партиции.

Задать настройки гибридного хранилища можно при создании или изменении кластера.

Подробнее о настройках гибридного хранилища см. в документации ClickHouse®.

Выбор типа дисков при создании кластераВыбор типа дисков при создании кластера

Количество хостов, которые можно создать вместе с кластером ClickHouse®, зависит от выбранного типа дисков:

  • При использовании локальных SSD-дисков (local-ssd) вы можете создать кластер из двух или более хостов.

    Такой кластер будет отказоустойчивым.

    Хранилище на локальных SSD-дисках влияет на тарификацию кластера: он тарифицируется, даже если остановлен. Подробнее в правилах тарификации.

  • При использовании сетевых нереплицируемых SSD-дисков (network-ssd-nonreplicated) вы можете создать кластер из трех или более хостов.

    Такой кластер будет отказоустойчивым.

  • Вы можете добавить любое количество хостов в пределах текущей квоты при использовании следующих типов дисков:

    • сетевые HDD-диски (network-hdd);
    • сетевые SSD-диски (network-ssd);
    • сверхбыстрые сетевые SSD-диски с тремя репликами (network-ssd-io-m3).

Подробнее об ограничениях на количество хостов в кластере см. в разделе Квоты и лимиты.

Шифрование дискаШифрование диска

При создании или восстановлении кластера из резервной копии можно зашифровать диск хранилища пользовательским ключом KMS. Чтобы зашифровать диск уже созданного кластера, отключить шифрование или зашифровать диск другим ключом, создайте резервную копию кластера и восстановите его с новыми настройками.

Важно

Функция шифрования недоступна для локальных дисков (local-hdd и local-ssd).

Для создания зашифрованного диска нужна роль kms.keys.user или выше.

Если деактивировать ключ, которым был зашифрован диск, доступ к данным будет приостановлен, пока ключ не будет снова активирован.

Внимание

Если удалить ключ, которым был зашифрован диск, или его версию, то доступ к данным будет безвозвратно потерян. Подробнее см. в документации Key Management Service.

Управление дисковым пространствомУправление дисковым пространством

В Managed Service for ClickHouse® при отсутствии свободного места в хранилище выполнение запросов на вставку (INSERT), фоновых мержей и мутаций приостанавливается. После увеличения размера хранилища их выполнение возобновляется автоматически.

Для отслеживания степени заполнения хранилища настройте алерты в Yandex Monitoring.

Автоматическое увеличение размера хранилищаАвтоматическое увеличение размера хранилища

Чтобы избежать ситуаций, когда свободное место на диске заканчивается и запросы на вставку, фоновые мержи и мутации перестают выполняться, настройте автоматическое увеличение размера хранилища для подкластеров ClickHouse® и ZooKeeper. В этом случае хранилище увеличивается при достижении установленного порога срабатывания — процента от общего размера хранилища. Есть два порога:

  • Порог для планового увеличения. Такое увеличение планируется по прогнозу алгоритма, который анализирует данные за последние несколько часов и оценивает, как быстро заполняется хранилище. Если расчеты показывают, что к началу ближайшего окна обслуживания заданный порог будет превышен, то планируется увеличение. Если проверка в начале обслуживания подтверждает, что заданный порог превышен, размер хранилища увеличивается.

  • Порог для незамедлительного увеличения. При его достижении размер хранилища увеличивается немедленно.

Можно использовать один либо оба порога. Если заданы оба, порог для незамедлительного увеличения должен быть не меньше, чем для планового.

Для планового увеличения необходимо настроить расписание окна обслуживания.

При достижении порога размер хранилища увеличивается в зависимости от типа диска:

  • Для сетевых HDD- и SSD-дисков — на большее из двух значений: 20 ГБ или 20% от текущего размера диска.

  • Для нереплицируемых SSD-дисков и сверхбыстрых сетевых SSD-дисков с тремя репликами — на 93 ГБ.

  • Для локальных SSD-дисков:

    • В кластере на платформе Intel Broadwell или Intel Cascade Lake — на 100 ГБ.
    • В кластере на платформе Intel Ice Lake — на 368 ГБ.

Если порог срабатывания достигнут повторно, размер хранилища будет автоматически увеличиваться, пока не достигнет заданного максимума. После этого вы можете задать новый максимальный размер хранилища.

Настройки автоматического увеличения размера хранилища, заданные для подкластера ClickHouse®, применяются ко всем существующим шардам внутри подкластера. При добавлении нового шарда значения настроек берутся с самого старого шарда.

Настроить автоматическое увеличение размера хранилища можно при создании или изменении кластера.

Важно

  • Размер хранилища нельзя уменьшить.
  • Во время изменения размера хранилища хосты кластера будут недоступны.

Примеры использованияПримеры использования

  • Использование гибридного хранилища в Managed Service for ClickHouse®
  • Шардирование таблиц в ClickHouse®

Была ли статья полезна?

Предыдущая
Квоты и лимиты
Следующая
Резервные копии
Проект Яндекса
© 2025 ООО «Яндекс.Облако»