Обзор СУБД Greenplum® и Apache Cloudberry™ в сервисе Yandex MPP Analytics for PostgreSQL
Сервис Yandex MPP Analytics for PostgreSQL позволяет разворачивать в инфраструктуре Yandex Cloud кластеры аналитических колоночных массово-параллельных (MPP
В сервисе доступны следующие СУБД:
-
Greenplum® — основана на PostgreSQL версии 9.4.
Greenplum® создавалась как open-source проект, но в 2024 году доступ к исходному коду закрыли. Несмотря на это, в сервисе Yandex MPP Analytics for PostgreSQL по-прежнему поддерживается Greenplum® версии 6 на основе ее open-source форка
. -
Apache Cloudberry™ — основана на Greenplum® версии 7, но использует более новое ядро PostgreSQL версии 14, а также поддерживает работу с динамическими таблицами и форматом PAX
.Apache Cloudberry™ — это open-source проект, который разрабатывается под лицензией Apache License v2.0.
Apache Cloudberry™ будет базовым дистрибутивом для новых мажорных версий сервиса Yandex MPP Analytics for PostgreSQL.
Подробнее о различиях Apache Cloudberry™ и Greenplum® в официальной документации Apache Cloudberry™
Yandex MPP Analytics for PostgreSQL берет на себя большую часть работ по обслуживанию кластеров, в том числе:
- Выделение ресурсов, создание и реконфигурация БД, установка обновлений ПО.
- Возвращение кластера в отказоустойчивое состояние в случае сбоя.
- Создание резервных копий при помощи WAL-G
, их хранение в S3-хранилище и восстановление данных на любой момент времени (PITR ).
Сервис также предлагает инструменты для самостоятельной работы с кластерами:
- Роли для управления доступом к данным.
- Командный центр и метрики для отслеживания состояния кластера.
- Расширение Yezzey для организации гибридного хранилища.
Кластеры Yandex MPP Analytics for PostgreSQL можно интегрировать с другими сервисами Yandex Cloud, например с Yandex Data Transfer для переноса БД или с Yandex DataLens для визуализации данных.
Сценарии применения Yandex MPP Analytics for PostgreSQL
- Аналитическая БД. Например, вы можете линейно ускорять выполнение масштабных хеш-соединений, добавляя дополнительные CPU или узлы.
- Универсальная БД на замену Oracle DB, Microsoft SQL Server или IBM DB2. Yandex MPP Analytics for PostgreSQL можно использовать не только для аналитических задач, но и для выполнения множества коротких OLTP-запросов, характерных для PostgreSQL.
- Более производительная альтернатива для БД PostgreSQL. Поскольку доступные в сервисе СУБД основаны на PostgreSQL, сервис поддерживает многие инструменты для работы с PostgreSQL, например интерфейсы JDBC и ODBC, а также стандарт ANSI SQL:2008.
См. также
- Официальная документация Greenplum®
- Официальная документация Apache Cloudberry™
- Как начать работать с Yandex MPP Analytics for PostgreSQL
- Взаимосвязь ресурсов сервиса Yandex MPP Analytics for PostgreSQL
- Практические руководства Yandex MPP Analytics for PostgreSQL
Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками Broadcom Inc в США и/или других странах.
Apache® и Apache Cloudberry™ являются зарегистрированными товарными знаками или товарными знаками Apache Software Foundation в США и/или других странах.