Подключение к хосту Yandex Data Processing из графических IDE
Вы можете подключиться к кластеру Yandex Data Processing с помощью графических IDE.
Перед подключением:
Подключитесь с помощью графических IDE
Подключения проверялись в следующем окружении:
- Ubuntu 20.04, DBeaver:
22.2.4; - MacOS Monterey 12.7:
- JetBrains DataGrip:
2023.3.4; - DBeaver Community:
24.0.0.
- JetBrains DataGrip:
Для использования графических IDE сохраните сертификат
- Создайте источник данных:
-
Выберите в меню File → New → Data Source → Apache Hive.
Примечание
Выберите источник данных в зависимости от компонента Yandex Data Processing, к которому вы подключаетесь:
- Hive — выберите Apache Hive;
- Spark — выберите Apache Spark.
Список настроек не меняется.
-
Укажите параметры подключения на вкладке General:
- Host — FQDN хоста-мастера кластера или его публичный IP-адрес;
- Если вы подключаетесь впервые, то нажмите ссылку Download, чтобы загрузить драйвер соединения.
-
На вкладке SSH/SSL:
- Включите настройку Use SSL и укажите параметры для SSL-подключения:
- CA file — загруженный ранее SSL-сертификат для подключения;
- Client key file, Client key password — файл закрытого ключа для подключения к кластеру Yandex Data Processing и пароль к нему.
- (Опционально) Для подключения через промежуточную ВМ настройте параметры SSH-туннеля:
- Выберите Use SSH tunnel, создайте SSH-конфигурацию и укажите параметры:
- Host — IP-адрес ВМ;
- User name — имя пользователя ВМ;
- Private key file, Passphrase — файл закрытого ключа для подключения к ВМ и пароль к нему.
- Нажмите ссылку Test Connection для проверки подключения к ВМ из DataGrip.
- Нажмите кнопку OK, чтобы сохранить конфигурацию.
- Выберите Use SSH tunnel, создайте SSH-конфигурацию и укажите параметры:
- Включите настройку Use SSL и укажите параметры для SSL-подключения:
-
- Нажмите ссылку Test Connection для проверки подключения. При успешном подключении будет выведен статус подключения OK, информация о СУБД и драйвере.
- Нажмите кнопку OK, чтобы сохранить источник данных.
- Загрузите SSH-ключ на локальную машину или ВМ для подключения к кластеру Yandex Data Processing.
- Создайте новое соединение с БД:
-
Выберите в меню База данных пункт Новое соединение.
-
Выберите из списка БД источник данных в зависимости от конфигурации кластера Yandex Data Processing, к которому вы подключаетесь:
- Если в кластере используется Hive — выберите Apache Hive.
- Если в кластере включен только Spark и включен Thrift-сервер — выберите Apache Spark.
Список настроек подключения не меняется в зависимости от выбранного источника данных.
-
Нажмите кнопку Далее.
-
На вкладке SSH включите настройку Использовать туннель SSH и укажите параметры:
- Хост/IP — FQDN (для подключения через промежуточную ВМ) или публичный IP-адрес хоста-мастера;
- Имя пользователя – укажите имя пользователя:
- для версии 2.0 —
ubuntu; - для версии 1.4 —
root.
- для версии 2.0 —
- Метод аутентификации —
Публичный ключ; - Секретный ключ — путь к файлу закрытого ключа кластера;
- Passphrase — пароль от закрытого ключа.
- (Опционально) Для подключения через промежуточную ВМ включите настройку Использовать jump сервер и укажите параметры:
- Хост/IP — публичный IP-адрес ВМ для подключения;
- Имя пользователя — логин для подключения к ВМ;
- Метод аутентификации —
Публичный ключ; - Секретный ключ — путь к файлу закрытого ключа ВМ;
- Passphrase — пароль от закрытого ключа.
-
- Нажмите кнопку Тест соединения ... для проверки подключения. При успешном подключении будет выведен статус подключения, информация о СУБД и драйвере.
- Нажмите кнопку Готово, чтобы сохранить настройки соединения с БД.