Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • AI Studio
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Managed Service for Greenplum®
  • Начало работы
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений
  • Обучающие курсы

В этой статье:

  • Перед началом работы
  • Создайте кластер
  • Получите идентификатор кластера
  • Подключитесь к кластеру
  • Создайте базу данных
  • Выполните несколько запросов к базе данных
  • Что дальше

Как начать работать с Managed Service for Greenplum®

Статья создана
Yandex Cloud
Улучшена
Danila N.
Обновлена 7 мая 2025 г.
  • Перед началом работы
  • Создайте кластер
  • Получите идентификатор кластера
  • Подключитесь к кластеру
  • Создайте базу данных
  • Выполните несколько запросов к базе данных
  • Что дальше

Чтобы начать работу с сервисом:

  1. Создайте кластер.
  2. Получите его идентификатор.
  3. Подключитесь к кластеру.
  4. Создайте базу данных.
  5. Выполните несколько запросов.

Для подключения к кластеру и работы с базами данных будут использоваться:

  • Графическая IDE DBeaver.
  • Консольный клиент psql.

Некоторые другие инструменты для работы с Greenplum® описаны в разделе Подключение к базе данных.

Перед началом работыПеред началом работы

  1. Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы.

  2. Если у вас еще нет каталога, создайте его:

    1. В консоли управления в списке слева выберите нужное облако.

    2. Справа сверху нажмите кнопку Создать каталог.

    3. Введите имя каталога. Требования к имени:

      • длина — от 2 до 63 символов;
      • может содержать строчные буквы латинского алфавита, цифры и дефисы;
      • первый символ — буква, последний — не дефис.
    4. (Опционально) Введите описание каталога.

    5. Выберите опцию Создать сеть по умолчанию. Будет создана сеть с подсетями в каждой зоне доступности. Также в этой сети будет создана группа безопасности по умолчанию, внутри которой весь сетевой трафик разрешен.

    6. Нажмите кнопку Создать.

  3. Назначьте вашему аккаунту в Yandex Cloud роль vpc.user и роль managed-greenplum.editor или выше. Эти роли позволяют создать кластер.

    Примечание

    Если вы не можете управлять ролями, обратитесь к администратору вашего облака или организации.

Создайте кластерСоздайте кластер

Создайте кластер Greenplum® с публичным доступом. К такому кластеру можно подключиться как с виртуальной машины Yandex Compute Cloud, так и через интернет.

Чтобы создать кластер:

  1. В консоли управления выберите каталог, в котором нужно создать кластер БД.

  2. Выберите сервис Managed Service for Greenplum.

  3. Нажмите кнопку Создать кластер.

  4. Укажите следующие параметры кластера:

    • Базовые параметры → Имя кластера — имя кластера. Оно должно быть уникальным в рамках каталога.

    • Сетевые настройки:

      • Сеть — укажите сеть, в которой нужно разместить хосты кластера.

      • Группы безопасности — укажите группы безопасности для сетевого трафика кластера.

        Настройте эти группы безопасности так, чтобы можно было подключаться к кластеру через интернет.

      • Зона доступности — укажите зону доступности для хостов кластера.

      • Подсеть — укажите подсеть для хостов кластера.

      • Публичный доступ — включите опцию.

    • Пользователь:

      • Имя пользователя — имя пользователя-администратора. Имя может содержать латинские буквы, цифры, дефис и подчеркивание, но не может начинаться с дефиса. Длина от 1 до 32 символов.

        Примечание

        Имена admin, gpadmin, mdb_admin, mdb_replication, monitor, none, postgres, public, repl зарезервированы для собственных нужд Managed Service for Greenplum®. Создавать пользователей с этими именами нельзя.

      • Пароль — пароль пользователя-администратора. Длина от 8 до 128 символов.

      Пользователь-администратор — это специальный пользователь, который необходим для управления кластером и не может быть удален. Подробнее см. в разделе Пользователи и роли в Managed Service for Greenplum®.

    • Master и Segment — конфигурация хостов-мастеров и хостов-сегментов в кластере Greenplum®.

      Измените настройки на этих вкладках, если конфигурация по умолчанию вам не подходит. Дополнительную информацию см. в разделе Расчет конфигурации кластера.

  5. Нажмите кнопку Создать кластер.

  6. Дождитесь, когда кластер будет готов к работе: его статус на панели Managed Service for Greenplum® сменится на Running, а состояние — на Alive. Это может занять некоторое время.

Подробнее о создании кластера см. в разделе Создание кластера Greenplum®.

Получите идентификатор кластераПолучите идентификатор кластера

Получите идентификатор кластера, который потребуется при подключении:

  1. В консоли управления перейдите на страницу каталога и выберите сервис Managed Service for Greenplum.
  2. Нажмите на имя нужного кластера и выберите вкладку Обзор.
  3. Скопируйте идентификатор кластера из блока Общая информация.

Подключитесь к кластеруПодключитесь к кластеру

После создания кластера подключитесь к нему:

DBeaver
psql
  1. Установите DBeaver на хост, с которого будет выполняться подключение.

    Примечание

    Работа с кластером проверялась в DBeaver Community 24.2.3.

  2. Запустите DBeaver.

  3. Выберите в меню База данных пункт Новое соединение.

  4. Выберите из списка БД Greenplum®.

  5. Нажмите кнопку Next.

  6. Укажите основные параметры соединения на вкладке Главное:

    • В блоке Server:

      • Connect by — Host.

      • Хост — особый FQDN первичного мастера: c-<идентификатор_кластера>.rw.mdb.yandexcloud.kz.

        Идентификатор кластера был получен ранее.

      • База данных — postgres.

      • Порт — 6432.

      • Показать все базы данных — включите опцию.

    • В блоке Аутентификация:

      • Аутентификация — Database Native.

      • Пользователь — имя пользователя-администратора, указанное при создании кластера.

      • Пароль — пароль пользователя-администратора.

        Если нужно, выключите опцию Сохранить пароль — эта опция включена по умолчанию.

  7. Нажмите кнопку Тест соединения.

    Если DBeaver предложит скачать файлы драйвера, то нажмите кнопку Скачать. Эти файлы могут отсутствовать, если ранее вы никогда не использовали DBeaver для подключения к Greenplum®.

    Введите пароль пользователя, если DBeaver его запросит, и нажмите кнопку OK.

    DBeaver подключится к базе данных postgres в кластере Greenplum®.

    При успешном подключении будет выведена информация о сервере Greenplum® и о драйвере, который использовался для подключения. Нажмите кнопку OK.

    Важно

    При подключении будет использоваться шифрованное подключение (с SSL), но без проверки подлинности хостов кластера. Это поведение по умолчанию для всех клиентов, которые используют библиотеку libpq.

    В промышленной эксплуатации подключайтесь к кластеру через SSL с проверкой подлинности хоста.

  8. (Опционально) На вкладке Главное нажмите кнопку Описание соединения (название, тип, ...) и укажите название и описание соединения.

    По умолчанию название соединения совпадает с указанным именем базы данных (postgres). Выберите другое название, чтобы избежать путаницы: с помощью этого соединения можно работать и с другими базами данных, а не только с postgres.

  9. Нажмите кнопку Finish.

    Созданное соединение появится на панели слева во вкладке Базы данных.

  10. Раскройте созданное соединение на панели слева во вкладке Базы данных.

    Введите пароль пользователя, если DBeaver его запросит, и нажмите кнопку OK.

    DBeaver подключится к базе данных postgres в кластере Greenplum®.

  11. Выполните тестовый запрос:

    1. Раскройте папку Базы данных, затем раскройте контекстное меню базы данных postgres и выберите пункт Редактор SQL → Open SQL console.

      Откроется консоль, в которой можно выполнять SQL-запросы к базе postgres.

    2. Вставьте запрос в консоль:

      SELECT version();
      
    3. Выполните запрос, нажав кнопку Выполнить SQL скрипт у левого края консоли.

      Либо выберите в меню Редактор SQL пункт Выполнить SQL скрипт.

  1. Установите клиент psql на хост, с которого будет выполняться подключение.

    Например, чтобы установить psql на виртуальную машину Linux в Yandex Cloud c Ubuntu 24.04:

    1. Подключитесь к виртуальной машине по OS Login или SSH.

    2. Установите необходимые зависимости и клиент PostgreSQL:

      sudo apt update && sudo apt install postgresql-client --yes
      
  2. Подключитесь к базе данных postgres в кластере Greenplum®. Используйте особый FQDN первичного мастера:

    psql "host=c-<идентификатор_кластера>.rw.mdb.yandexcloud.kz \
      port=6432 \
      dbname=postgres \
      user=<имя_пользователя>"
    

    Идентификатор кластера был получен ранее.

    После выполнения команды введите пароль пользователя для завершения процедуры подключения.

    Важно

    При подключении будет использоваться шифрованное подключение (с SSL), но без проверки подлинности хостов кластера. Это поведение по умолчанию для всех клиентов, которые используют библиотеку libpq.

    В промышленной эксплуатации подключайтесь к кластеру через SSL с проверкой подлинности хоста.

  3. Выполните тестовый запрос:

    SELECT version();
    

При успешном подключении к кластеру и выполнении тестового запроса будет выведена версия Greenplum®.

Создайте базу данныхСоздайте базу данных

В созданном ранее кластере Greenplum® есть только одна база данных — служебная база данных postgres. Эта база не предназначена для хранения пользовательских данных: например, в такой базе нельзя создавать схемы данных (schemas).

После подключения к кластеру Greenplum® создайте базу sample_db для хранения пользовательских данных:

DBeaver
psql
  1. Раскройте созданное ранее соединение на панели слева во вкладке Базы данных.

    Введите пароль пользователя, если DBeaver его запросит, и нажмите кнопку OK.

    DBeaver подключится к базе данных postgres в кластере Greenplum®.

  2. Создайте базу данных:

    1. Раскройте папку Базы данных, затем раскройте контекстное меню базы данных postgres и выберите пункт Редактор SQL → Open SQL console.

      Откроется консоль, в которой можно выполнять SQL-запросы к базе postgres.

    2. Вставьте запрос в консоль:

      CREATE DATABASE sample_db;
      
    3. Выполните запрос, нажав кнопку Выполнить SQL скрипт у левого края консоли.

      Либо выберите в меню Редактор SQL пункт Выполнить SQL скрипт.

  3. Обновите список баз данных, чтобы в нем появилась созданная база.

    Для этого раскройте контекстное меню папки Базы данных и выберите пункт Refresh.

    Совет

    Если база sample_db не появилась в списке, то проверьте, что для соединения была включена опция Показать все базы данных.

  1. Выполните запрос:

    CREATE DATABASE sample_db;
    
  2. Выведите список баз данных в кластере Greenplum® и убедитесь, что в нем присутствует база sample_db:

    \list
    

Выполните несколько запросов к базе данныхВыполните несколько запросов к базе данных

Чтобы подтвердить, что база данных была создана корректно, выполните несколько запросов к ней:

DBeaver
psql
  1. Раскройте созданное ранее соединение на панели слева во вкладке Базы данных.

    Введите пароль пользователя, если DBeaver его запросит, и нажмите кнопку OK.

    DBeaver подключится к базе данных postgres в кластере Greenplum®.

  2. Раскройте папку Базы данных, затем раскройте контекстное меню базы данных sample_db и выберите пункт Редактор SQL → Open SQL console.

    Откроется консоль, в которой можно выполнять SQL-запросы к базе sample_db.

  3. Создайте таблицу и наполните ее данными:

    1. Вставьте запросы в консоль:

      CREATE TABLE sample_table (a int)
          DISTRIBUTED BY (a);
      
      INSERT INTO sample_table
          SELECT * FROM GENERATE_SERIES(1, 10000);
      
    2. Выполните запрос, нажав кнопку Выполнить SQL скрипт у левого края консоли.

      Либо выберите в меню Редактор SQL пункт Выполнить SQL скрипт.

    Таблица будет создана, а затем наполнена числами от 1 до 10000.

    Запросы CREATE TABLE и INSERT INTO не возвращают никаких результатов. DBeaver отобразит статистику по выполненным запросам, которая имеет вид:

    Queries         2
    Updated Rows    10000
    Execute time    ...
    Fetch time      ...
    Total time      ...
    Start time      ...
    Finish time     ...
    
  4. Получите сумму всех чисел в таблице. Для этого очистите консоль, вставьте запрос и выполните его:

    SELECT sum(a) FROM sample_table;
    

    Ожидаемый результат:

    sum     |
    --------+
    50005000|
    
  5. Получите информацию о том, как 10000 строк таблицы распределены по сегментам Greenplum®. Для этого очистите консоль, вставьте запрос и выполните его:

    SELECT gp_segment_id, count(*)
        FROM sample_table
        GROUP BY gp_segment_id;
    

    Результат будет зависеть от того, сколько сегментов есть в кластере. Распределение строк по сегментам также может отличаться.

    Пример результата для кластера с двумя сегментами:

    gp_segment_id|count|
    -------------+-----+
                0| 5013|
                1| 4987|
    
  6. Завершите сеанс работы с соединением. Для этого раскройте контекстное меню соединения и выберите пункт Отсоединиться.

  1. Убедитесь, что вы подключены к базе данных sample_db:

    SELECT current_database();
    

    Если запрос возвращает имя другой базы данных, например, postgres, подключитесь к нужной базе:

    \connect sample_db;
    
  2. Создайте таблицу и наполните ее данными:

    CREATE TABLE sample_table (a int)
        DISTRIBUTED BY (a);
    
    INSERT INTO sample_table
        SELECT * FROM GENERATE_SERIES(1, 10000);
    

    Таблица будет создана, а затем наполнена числами от 1 до 10000.

    Запросы CREATE TABLE и INSERT INTO не возвращают никаких результатов.

  3. Получите сумму всех чисел в таблице:

    SELECT sum(a) FROM sample_table;
    

    Ожидаемый результат:

    sum     |
    --------+
    50005000|
    
  4. Получите информацию о том, как 10000 строк таблицы распределены по сегментам Greenplum®:

    SELECT gp_segment_id, count(*)
        FROM sample_table
        GROUP BY gp_segment_id;
    

    Результат будет зависеть от того, сколько сегментов есть в кластере. Распределение строк по сегментам также может отличаться.

    Пример результата для кластера с двумя сегментами:

    gp_segment_id|count|
    -------------+-----+
                0| 5013|
                1| 4987|
    
  5. Завершите сеанс работы с psql:

    \quit
    

Что дальшеЧто дальше

  • Изучите концепции сервиса.
  • Узнайте подробнее о создании кластера и подключении к кластеру.

Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками Broadcom Inc в США и/или других странах.

Была ли статья полезна?

Следующая
Все инструкции
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»