Программа курса «Greenplum® для дата-инженеров»
Программа состоит из 4 тем и длится 5 недель.
Содержание
Тема 1. Общая информация про Greenplum
- Знакомство с Greenplum
- Архитектура Greenplum
- Yandex Managed Service for Greenplum®
- Практика: создание кластера
Тема 2. Физическая модель данных и DDL
- Ключевые сущности Greenplum
- Таблицы: виды, дистрибуция и сжатие
- Таблицы: партиционирование
- Прочие объекты БД. Зависимости между объектами
- Типы данных
- Преобразование типов данных
Тема 3. Работа с внешними источниками
- Интеграция со смежными системами
- Yandex Data Transfer для загрузки данных из внешних систем
Тема 4. Оптимизация производительности запросов
- Планы запросов и статистика
- Механика выполнения запросов в Greenplum
- Лучшие практики оптимизации запросов
Необходимые пререквизиты
Работа с SQL
Вы знакомы с SQL и умеете писать и читать запросы.
Работа с одной или несколькими СУБД
Вы знакомы с базовыми понятиями реляционных СУБД и уже работали в одной из них: PostgreSQL или MySQL®.
Работа в IDE или терминалах
У вас есть опыт работы с IDE или с терминальными клиентами баз данных.