Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex MPP Analytics for PostgreSQL
  • Начало работы
    • Обзор СУБД Greenplum® и сервиса Yandex MPP Analytics for PostgreSQL
    • Взаимосвязь ресурсов сервиса
    • Классы хостов
    • Расчет конфигурации кластера
    • Сеть в Yandex MPP Analytics for PostgreSQL
      • Типы дисков
      • Типы хранения данных
      • Гибридное хранилище
    • Квоты и лимиты
    • Резервные копии
    • Ресурсные группы
    • Шардирование
    • Пользователи и роли
    • Аутентификация пользователей
    • Командный центр
    • Параметры командного центра
    • Внешние таблицы
    • Управление соединениями
    • Расширение кластера
    • Техническое обслуживание
    • Настройки Greenplum®
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Область применения гибридного хранилища
  • Управление вводом-выводом при использовании гибридного хранилища
  • Примеры использования
  1. Концепции
  2. Хранилище в Yandex MPP Analytics for PostgreSQL
  3. Гибридное хранилище

Гибридное хранилище в Yandex MPP Analytics for PostgreSQL

Статья создана
Yandex Cloud
Обновлена 13 ноября 2025 г.
  • Область применения гибридного хранилища
  • Управление вводом-выводом при использовании гибридного хранилища
  • Примеры использования

Примечание

Функциональность находится на стадии Preview и не тарифицируется.

В кластерах Yandex MPP Analytics for PostgreSQL поддерживается гибридное хранилище: часть данных может находиться в хранилище кластера, а часть — в холодном хранилище. По умолчанию данные хранятся в хранилище кластера на дисках выбранного типа. Данные, с которыми работают редко, но которые нужно хранить долго, можно перенести из хранилища кластера в холодное хранилище — в служебный бакет Yandex Object Storage. Так хранение будет дешевле.

Гибридное хранилище можно включить в кластерах Greenplum® при создании или изменении кластера.

Важно

Включенное в кластере гибридное хранилище нельзя отключить.

Область применения гибридного хранилищаОбласть применения гибридного хранилища

Гибридное хранилище можно использовать только для таблиц, которые оптимизированы для добавления (append-optimized). При переносе данных между хранилищем кластера и холодным хранилищем переносятся таблицы целиком. Для работы с таблицами используется расширение Yezzey, разработанное Yandex Cloud.

Данные таблиц, оптимизированных для добавления, хранятся в виде набора сегментных файлов в сжатом и зашифрованном виде в служебном бакете Object Storage. Количество сегментных файлов зависит от количества сегментов в кластере и от структуры таблицы.

Управление вводом-выводом при использовании гибридного хранилищаУправление вводом-выводом при использовании гибридного хранилища

При выполнении SQL-запросов к таблицам, оптимизированным для добавления, происходит множество обращений к сегментным файлам в хранилище. Время выполнения SQL-запросов зависит от того, насколько эффективно планируются запросы ввода-вывода к сегментным файлам. Если не планировать запросы ввода-вывода, то страдает производительность хранилища, увеличивается потребление оперативной памяти и время выполнения SQL-запросов. Использование планировщика позволяет защитить кластер от деградации производительности при выполнении SQL-запросов, требующих обработки большого количества данных.

Когда данные хранятся в хранилище кластера, планированием запросов ввода-вывода занимается операционная система на хостах кластера.

Когда данные хранятся в холодном хранилище, операционная система не может планировать запросы ввода-вывода к служебному бакету Object Storage. Поэтому, чтобы избежать деградации производительности, в кластерах Yandex MPP Analytics for PostgreSQL планированием таких запросов занимается специальный прокси YProxy, разработанный Yandex Cloud. Благодаря использованию YProxy, даже если таблица размещена в холодном хранилище, то это оказывает минимальное влияние на время выполнения SQL-запросов.

Подробнее про архитектуру гибридного хранилища читайте в статье на Хабре. В статье также приводятся тесты производительности для разных типов хранилищ.

Примеры использованияПримеры использования

  • Выгрузка данных Greenplum® в холодное хранилище Yandex Object Storage

Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками Broadcom Inc в США и/или других странах.

Была ли статья полезна?

Предыдущая
Типы хранения данных
Следующая
Квоты и лимиты
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»