Программа курса «Greenplum® в сервисе Yandex MPP Analytics for PostgreSQL для дата‑инженеров»
Программа состоит из 4 тем и длится 5 недель.
Содержание
Тема 1. Общая информация о Greenplum
- Знакомство с Greenplum
- Архитектура Greenplum
- Greenplum в сервисе Yandex MPP Analytics for PostgreSQL
- Практика: создание кластера
Тема 2. Физическая модель данных и DDL
- Ключевые сущности Greenplum
- Таблицы: виды, дистрибуция и сжатие
- Таблицы: партицирование
- Типы данных
- Преобразование типов данных
- Индексы, ограничения целостности и последовательности
- Представления и функции. Зависимости между объектами
- Практика. Проектирование таблицы
Тема 3. Работа с внешними источниками
- Инструменты СУБД Greenplum для загрузки и выгрузки данных
- Практика: загрузка и выгрузка данных
Тема 4. Оптимизация производительности запросов
- Как выполняются запросы в Greenplum
- Операторы в плане запроса. Спилл‑файлы
- Факторы, влияющие на план запроса
- Анализ запросов
- Оптимизация производительности запросов
- Практика: оптимизация запроса
Необходимые пререквизиты
Работа с SQL
Вы знакомы с SQL и умеете писать и читать запросы.
Работа с одной или несколькими СУБД
Вы знакомы с базовыми понятиями реляционных СУБД и уже работали в одной из них: PostgreSQL или MySQL®.
Работа в IDE или терминалах
У вас есть опыт работы с IDE или с терминальными клиентами баз данных.