Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2026 ТОО «Облачные Сервисы Казахстан»
Yandex MPP Analytics for PostgreSQL
  • Начало работы
    • Все инструкции
    • Подключение к внешнему файловому серверу (gpfdist)
      • Управление расширениями
      • gp_relsizes_stats
      • gp_url_tools
      • pgcrypto
      • uuid-cb
      • Yezzey
    • Вспомогательные утилиты
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Схема данных
  • Настройки расширения
  • Установка расширения gp_relsizes_stats в кластер Greenplum®
  • Примеры использования
  • Размеры таблиц
  • Размеры схем
  • История роста таблицы
  1. Пошаговые инструкции
  2. Расширения Greenplum®
  3. gp_relsizes_stats

Использование gp_relsizes_stats в Yandex MPP Analytics for PostgreSQL

Статья создана
Yandex Cloud
Обновлена 22 декабря 2025 г.
  • Схема данных
  • Настройки расширения
  • Установка расширения gp_relsizes_stats в кластер Greenplum®
  • Примеры использования
    • Размеры таблиц
    • Размеры схем
    • История роста таблицы

Расширение gp_relsizes_stats предназначено для сбора статистики о физических размерах файлов и таблиц на всех сегментах кластера Greenplum®.

Ключевые возможности:

  • Автоматический сбор статистики через фоновый воркер (background worker).
  • Мониторинг всех сегментов кластера одновременно.
  • Гибкие настройки производительности для контроля нагрузки на систему.
  • Отслеживание истории изменения размеров таблиц.
  • Ручной запуск сбора статистики при необходимости.

Компоненты расширения:

  • Главный фоновый воркер. Если включен, периодически инициирует сбор статистики. Запускается в базе данных postgres.
  • Воркеры для конкретных баз данных.
  • Функция сбора статистики. Сканирует файловую систему для подсчета размеров файлов. Выполняется на каждом сегменте.

Схема данныхСхема данных

При установке расширения создается схема relsizes_stats_schema со следующими таблицами.

Основные таблицы:

Таблица Описание Структура
segment_file_map Маппинг идентификаторов таблиц (reloid) и имен файлов таблиц на диске (relfilenode) для каждого сегмента. segment, reloid, relfilenode
segment_file_sizes Размеры файлов по сегментам. segment, relfilenode, filepath, size, mtime
table_sizes_history История размеров таблиц. insert_date, nspname, relname, size, mtime

Представления для анализа:

Таблица Описание
table_files Детальная информация о файлах таблиц с типами (main, toast, ao и т. д.).
table_sizes Агрегированные размеры таблиц по всем сегментам.
namespace_sizes Размеры схем базы данных.

Настройки расширенияНастройки расширения

Настройка Значение по умолчанию Описание
relsizes_stats.on True Если настройка включена, расширение доступно для установки в базу данных.
relsizes_stats.enable False Если настройка включена, создается главный фоновый воркер, который периодически запускает сбор статистики по всему кластеру.
Если вы хотите использовать ручной сбор статистики, эту настройку рекомендуется отключить, чтобы не создавать фоновую нагрузку.
relsizes_stats.restart_naptime 21 600 000 мс Определяет периодичность сбора статистики по всему кластеру.
relsizes_stats.database_naptime 0 мс Определяет время ожидания между сбором статистики для разных баз данных.
relsizes_stats.file_naptime 1 мс Определяет время ожидания между обработкой разных файлов. Это позволяет лимитировать фоновую нагрузку, которую создает сбор статистики, распределяя ее во времени.

Чтобы изменить настройки, обратитесь в службу технической поддержки.

Установка расширения gp_relsizes_stats в кластер Greenplum®Установка расширения gp_relsizes_stats в кластер Greenplum®

  1. Подключитесь к базе данных от имени владельца или пользователя, имеющего в базе данных разрешение CREATE, и выполните команду:

    CREATE EXTENSION gp_relsizes_stats;
    
  2. Проверьте, что расширение было установлено:

    SELECT extname FROM pg_extension;
    

    Будет выведен список расширений, установленных в БД:

          extname
    -------------------
     ...
     gp_relsizes_stats
    

Примеры использованияПримеры использования

В качестве примера рассмотрим сбор статистики по базе данных колл-центра. Для этого подготовьте исходные данные:

  1. Создайте схему call_center:

    CREATE SCHEMA call_center;
    
  2. Создайте таблицу operators в схеме call_center:

    CREATE TABLE call_center.operators (
        id INTEGER PRIMARY KEY,
        operator_name varchar (20),
        operator_id INTEGER
    );
    
  3. Вставьте в таблицу operators сгенерированные данные:

    INSERT INTO call_center.operators (id, operator_name, operator_id)
    SELECT 
        generate_series(1, 1000) AS id,
        'Operator ' || generate_series(1, 1000) AS operator_name,
        10000 + generate_series(1, 1000) AS operator_id;
    
  4. Запустите вручную сбор статистики:

    SELECT relsizes_stats_schema.relsizes_collect_stats_once();
    

Размеры таблицРазмеры таблиц

Чтобы вывести из всей базы данных 20 таблиц с наибольшим размером, выполните команду:

SELECT nspname, relname,
       pg_size_pretty(size) as size_pretty,
       mtime
FROM relsizes_stats_schema.table_sizes
ORDER BY size DESC
LIMIT 20;

Чтобы вывести размер таблицы operators, выполните команду:

SELECT relname, pg_size_pretty(size) as size_pretty
FROM relsizes_stats_schema.table_sizes
WHERE nspname='call_center' AND relname='operators';

Размеры схемРазмеры схем

Чтобы вывести размеры всех схем в базе данных, выполните команду:

SELECT nspname, pg_size_pretty(size) as size_pretty
FROM relsizes_stats_schema.namespace_sizes
ORDER BY size DESC;

Чтобы вывести размер схемы call_center, выполните команду:

SELECT nspname, pg_size_pretty(size) as size_pretty
FROM relsizes_stats_schema.namespace_sizes
WHERE nspname='call_center';

История роста таблицыИстория роста таблицы

Чтобы вывести историю изменения размера таблицы operators, выполните команду:

SELECT insert_date, pg_size_pretty(size) as size_pretty
FROM relsizes_stats_schema.table_sizes_history
WHERE nspname='call_center' AND relname='operators'
ORDER BY insert_date;

Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками Broadcom Inc в США и/или других странах.

Была ли статья полезна?

Предыдущая
Управление расширениями
Следующая
gp_url_tools
Проект Яндекса
© 2026 ТОО «Облачные Сервисы Казахстан»