Программа курса «Greenplum® для дата-инженеров»

Программа состоит из 4 тем и длится 5 недель.

Содержание

Тема 1. Общая информация про Greenplum

  1. Знакомство с Greenplum
  2. Архитектура Greenplum
  3. Yandex Managed Service for Greenplum®
  4. Практика: создание кластера

Тема 2. Физическая модель данных и DDL

  1. Ключевые сущности Greenplum
  2. Таблицы: виды, дистрибуция и сжатие
  3. Таблицы: партиционирование
  4. Прочие объекты БД. Зависимости между объектами
  5. Типы данных
  6. Преобразование типов данных

Тема 3. Работа с внешними источниками

  1. Интеграция со смежными системами
  2. Yandex Data Transfer для загрузки данных из внешних систем

Тема 4. Оптимизация производительности запросов

  1. Планы запросов и статистика
  2. Механика выполнения запросов в Greenplum
  3. Лучшие практики оптимизации запросов

Необходимые пререквизиты

Работа с SQL

Вы знакомы с SQL и умеете писать и читать запросы.

Работа с одной или несколькими СУБД

Вы знакомы с базовыми понятиями реляционных СУБД и уже работали в одной из них: PostgreSQL или MySQL®.

Работа в IDE или терминалах

У вас есть опыт работы с IDE или с терминальными клиентами баз данных.