Как начать работать с Yandex Managed Service for Trino
Примечание
Сервис находится на стадии Preview.
Чтобы начать работу с сервисом:
- Создайте кластер Managed Service for Trino.
- Подключитесь к кластеру Managed Service for Trino.
- Отправьте запросы к кластеру Yandex Managed Service for PostgreSQL через Trino.
- Проверьте запросы в кластере Managed Service for PostgreSQL.
Перед началом работы
-
Перейдите в консоль управления
, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы. -
Если у вас еще нет каталога, создайте его:
-
В консоли управления
в списке слева выберите нужное облако. -
Справа сверху нажмите кнопку Создать каталог.
-
Введите имя каталога. Требования к имени:
- длина — от 2 до 63 символов;
- может содержать строчные буквы латинского алфавита, цифры и дефисы;
- первый символ — буква, последний — не дефис.
-
(Опционально) Введите описание каталога.
-
Выберите опцию Создать сеть по умолчанию. Будет создана сеть с подсетями в каждой зоне доступности. Также в этой сети будет создана группа безопасности по умолчанию, внутри которой весь сетевой трафик разрешен.
-
Нажмите кнопку Создать.
-
-
Назначьте вашему аккаунту в Yandex Cloud роли:
- managed-trino.admin — чтобы создать кластер;
- vpc.user — чтобы работать с сетью кластера;
- iam.serviceAccounts.user — чтобы привязать сервисный аккаунт к кластеру.
Примечание
Если вы не можете управлять ролями, обратитесь к администратору вашего облака или организации.
-
Создайте сервисный аккаунт с ролями
managed-trino.integrationProvider
иstorage.editor
. -
Создайте кластер Yandex Managed Service for PostgreSQL, с которым будет работать Trino.
Создайте кластер Managed Service for Trino
-
В консоли управления
выберите каталог, в котором нужно создать кластер Managed Service for Trino. -
Выберите сервис Managed Service for Trino.
-
Нажмите кнопку Создать кластер.
-
Задайте имя кластера.
-
В поле Сервисный аккаунт выберите созданный ранее сервисный аккаунт.
-
В блоке Сетевые настройки выберите сеть, подсеть и группу безопасности для кластера.
-
Задайте конфигурацию координатора и воркеров.
-
В блоке Каталоги добавьте каталоги:
-
Для кластера Managed Service for PostgreSQL со следующими параметрами:
-
Имя каталога —
test
. -
Тип коннектора —
PostgreSQL
. -
URL —
jdbc:postgresql://<FQDN_хоста_кластера_PostgreSQL>:6432/<имя_базы_данных>?ssl=true&sslmode=verify-full
.Подробнее о получении FQDN хоста в кластере Managed Service for PostgreSQL см. в инструкции.
-
Имя пользователя — имя пользователя в кластере Managed Service for PostgreSQL.
-
Пароль — пароль пользователя.
-
-
Для тестовых данных со следующими параметрами:
- Имя каталога —
data
. - Тип коннектора —
TPC-H
.
- Имя каталога —
Вы можете добавить каталоги как при создании кластера, так и после его создания.
-
-
(Опционально) В блоке Дополнительные настройки настройте логирование:
- Включите настройку Запись логов.
- Выберите место записи логов:
- Каталог — выберите каталог из списка.
- Группа — выберите лог-группу из списка или создайте новую.
- Выберите Минимальный уровень логирования из списка.
-
Нажмите кнопку Создать.
-
Дождитесь, когда кластер будет готов к работе: его статус на панели Managed Service for Trino сменится на Running, а состояние — на Alive. Это может занять некоторое время.
Подключитесь к кластеру Managed Service for Trino через Trino CLI
Если у вас еще нет интерфейса командной строки Trino, установите его по инструкции на официальном сайте Trino
Чтобы подключиться к кластеру Managed Service for Trino:
-
Создайте IAM-токен и поместите его в переменную окружения
TRINO_PASSWORD
:export TRINO_PASSWORD=$(yc iam create-token)
IAM-токен, хранящийся в переменной
TRINO_PASSWORD
, служит паролем для подключения к кластеру Managed Service for Trino. Чтобы использовать его, укажите при подключении флаг--password
. -
Подключитесь к кластеру Managed Service for Trino:
./trino <URL_координатора> --user iam --password
Вы можете скопировать URL координатора в поле Координатор на странице обзора кластера Trino в Консоли управления
.
Отправьте запросы к кластеру Managed Service for PostgreSQL через Trino
-
Подключитесь к кластеру Trino через Trino CLI.
Все дальнейшие шаги выполняются через Trino CLI.
-
Создайте в кластере Managed Service for PostgreSQL новую схему:
CREATE SCHEMA IF NOT EXISTS test.tpch_postgresql;
-
Создайте таблицу:
CREATE TABLE IF NOT EXISTS test.tpch_postgresql.customers ( name VARCHAR, phone VARCHAR, acctbal DOUBLE );
-
Наполните таблицу данными из каталога с тестовыми данными:
INSERT INTO test.tpch_postgresql.customers SELECT name, phone, acctbal FROM data.sf100000.customer LIMIT 1000000;
-
Запросите количество строк в таблице:
SELECT COUNT(*) as count FROM test.tpch_postgresql.customers;
Ожидаемый ответ:
count --------- 1000000 (1 row)
Проверьте запросы в кластере Managed Service for PostgreSQL
Чтобы проверить выполнение запросов в кластере Managed Service for PostgreSQL, подключитесь к БД в кластере и запросите количество строк в таблице customers
:
SELECT COUNT(*) FROM tpch_postgresql.customers;
Ожидаемый ответ:
count
---------
1000000
(1 row)
Что дальше
- Ознакомьтесь с другими способами подключения к кластеру Managed Service for Trino.