Подключение к хосту Yandex Data Processing из графических IDE

Статья создана

Yandex Cloud

Обновлена 4 сентября 2025 г.

Открыть в Markdown

Вы можете подключиться к кластеру Yandex Data Processing с помощью графических IDE.

Перед подключением:

Подключитесь с помощью графических IDE

Подключения проверялись в следующем окружении:

Ubuntu 20.04, DBeaver: 22.2.4;
MacOS Monterey 12.7:
- JetBrains DataGrip: 2023.3.4;
- DBeaver Community: 24.0.0.

Для использования графических IDE сохраните сертификат в локальную папку и укажите путь к нему в настройках подключения.

DataGrip

DBeaver

Создайте источник данных:
1. Выберите в меню File → New → Data Source → Apache Hive.
  Примечание
  Выберите источник данных в зависимости от компонента Yandex Data Processing, к которому вы подключаетесь:
  - Hive — выберите Apache Hive;
  - Spark — выберите Apache Spark.
  Список настроек не меняется.
2. Укажите параметры подключения на вкладке General:
  - Host — FQDN хоста-мастера кластера или его публичный IP-адрес;
  - Если вы подключаетесь впервые, то нажмите ссылку Download, чтобы загрузить драйвер соединения.
3. На вкладке SSH/SSL:
  1. Включите настройку Use SSL и укажите параметры для SSL-подключения:
    - CA file — загруженный ранее SSL-сертификат для подключения;
    - Client key file, Client key password — файл закрытого ключа для подключения к кластеру Yandex Data Processing и пароль к нему.
  2. (Опционально) Для подключения через промежуточную ВМ настройте параметры SSH-туннеля:
    1. Выберите Use SSH tunnel, создайте SSH-конфигурацию и укажите параметры:
      - Host — IP-адрес ВМ;
      - User name — имя пользователя ВМ;
      - Private key file, Passphrase — файл закрытого ключа для подключения к ВМ и пароль к нему.
    2. Нажмите ссылку Test Connection для проверки подключения к ВМ из DataGrip.
    3. Нажмите кнопку OK, чтобы сохранить конфигурацию.
Нажмите ссылку Test Connection для проверки подключения. При успешном подключении будет выведен статус подключения OK, информация о СУБД и драйвере.
Нажмите кнопку OK, чтобы сохранить источник данных.

Загрузите SSH-ключ на локальную машину или ВМ для подключения к кластеру Yandex Data Processing.
Создайте новое соединение с БД:
1. Выберите в меню База данных пункт Новое соединение.
2. Выберите из списка БД источник данных в зависимости от конфигурации кластера Yandex Data Processing, к которому вы подключаетесь:
  - Если в кластере используется Hive — выберите Apache Hive.
  - Если в кластере включен только Spark и включен Thrift-сервер — выберите Apache Spark.
  Список настроек подключения не меняется в зависимости от выбранного источника данных.
3. Нажмите кнопку Далее.
4. На вкладке SSH включите настройку Использовать туннель SSH и укажите параметры:
  - Хост/IP — FQDN (для подключения через промежуточную ВМ) или публичный IP-адрес хоста-мастера;
  - Имя пользователя – укажите имя пользователя:
    - для версии 2.0 — ubuntu;
    - для версии 1.4 — root.
  - Метод аутентификации — Публичный ключ;
  - Секретный ключ — путь к файлу закрытого ключа кластера;
  - Passphrase — пароль от закрытого ключа.
  - (Опционально) Для подключения через промежуточную ВМ включите настройку Использовать jump сервер и укажите параметры:
    - Хост/IP — публичный IP-адрес ВМ для подключения;
    - Имя пользователя — логин для подключения к ВМ;
    - Метод аутентификации — Публичный ключ;
    - Секретный ключ — путь к файлу закрытого ключа ВМ;
    - Passphrase — пароль от закрытого ключа.
Нажмите кнопку Тест соединения ... для проверки подключения. При успешном подключении будет выведен статус подключения, информация о СУБД и драйвере.
Нажмите кнопку Готово, чтобы сохранить настройки соединения с БД.

Подключение к хосту Yandex Data Processing из графических IDE

Подключитесь с помощью графических IDEПодключитесь с помощью графических IDE

Была ли статья полезна?

Подключитесь с помощью графических IDE