Программа курса «Greenplum® в сервисе Yandex MPP Analytics for PostgreSQL для дата‑инженеров»

Программа состоит из 4 тем и длится 5 недель.

Содержание

Тема 1. Общая информация о Greenplum

  1. Знакомство с Greenplum
  2. Архитектура Greenplum
  3. Greenplum в сервисе Yandex MPP Analytics for PostgreSQL
  4. Практика: создание кластера

Тема 2. Физическая модель данных и DDL

  1. Ключевые сущности Greenplum
  2. Таблицы: виды, дистрибуция и сжатие
  3. Таблицы: партицирование
  4. Типы данных
  5. Преобразование типов данных
  6. Индексы, ограничения целостности и последовательности
  7. Представления и функции. Зависимости между объектами
  8. Практика. Проектирование таблицы

Тема 3. Работа с внешними источниками

  1. Инструменты СУБД Greenplum для загрузки и выгрузки данных
  2. Практика: загрузка и выгрузка данных

Тема 4. Оптимизация производительности запросов

  1. Как выполняются запросы в Greenplum
  2. Операторы в плане запроса. Спилл‑файлы
  3. Факторы, влияющие на план запроса
  4. Анализ запросов
  5. Оптимизация производительности запросов
  6. Практика: оптимизация запроса

Необходимые пререквизиты

Работа с SQL

Вы знакомы с SQL и умеете писать и читать запросы.

Работа с одной или несколькими СУБД

Вы знакомы с базовыми понятиями реляционных СУБД и уже работали в одной из них: PostgreSQL или MySQL®.

Работа в IDE или терминалах

У вас есть опыт работы с IDE или с терминальными клиентами баз данных.