Yandex Cloud
Поиск
Связаться с экспертомПопробовать бесплатно
  • Кейсы
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Кейсы
  • Документация
  • Блог
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»
Yandex Lockbox
  • Начало работы
    • Все руководства
    • Синхронизация с секретами Managed Service for Kubernetes
    • Хранение подключений и переменных Apache Airflow™ в Yandex Lockbox
    • Построение пайплайна CI/CD в GitLab с использованием serverless-продуктов
    • Безопасное хранение паролей для GitLab CI в виде секретов Yandex Lockbox
    • Загрузка данных из Яндекс Директ в витрину Yandex Managed Service for ClickHouse® с использованием Yandex Cloud Functions, Yandex Object Storage и Yandex Data Transfer
    • Развертывание отказоустойчивой архитектуры с прерываемыми ВМ
    • Создание интерактивного serverless-приложения с использованием WebSocket
    • Автоматическое копирование объектов из одного бакета Object Storage в другой
    • Безопасная передача пароля в скрипт инициализации
    • Использование секрета в PySpark-задании для подключения к Yandex Managed Service for PostgreSQL
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Вопросы и ответы

В этой статье:

  • Перед началом работы
  • Необходимые платные ресурсы
  • Подготовьте инфраструктуру
  • Настройте права доступа к секрету пользователя Managed Service for PostgreSQL
  • Подготовьте PySpark-задание
  • Запустите задание и проверьте результат
  • Удалите созданные ресурсы
  1. Практические руководства
  2. Использование секрета в PySpark-задании для подключения к Yandex Managed Service for PostgreSQL

Использование секрета Yandex Lockbox в PySpark-задании для подключения к Yandex Managed Service for PostgreSQL

Статья создана
Yandex Cloud
Улучшена
mmerihsesh
Обновлена 11 марта 2026 г.
  • Перед началом работы
    • Необходимые платные ресурсы
  • Подготовьте инфраструктуру
  • Настройте права доступа к секрету пользователя Managed Service for PostgreSQL
  • Подготовьте PySpark-задание
  • Запустите задание и проверьте результат
  • Удалите созданные ресурсы

Вы можете использовать секрет Yandex Lockbox для подключения к кластеру Yandex Managed Service for PostgreSQL из PySpark-задания в Yandex Managed Service for Apache Spark™. Для этого сервисному аккаунту кластера Yandex Managed Service for Apache Spark™ необходимо предоставить доступ к секрету. Секрет создается сервисом Yandex Connection Manager автоматически при создании пользователя Managed Service for PostgreSQL.

Для PySpark-задания используется Python-скрипт, который хранится в бакете Yandex Object Storage. Скрипт получает пароль пользователя из секрета и использует его для подключения к кластеру Managed Service for PostgreSQL.

Чтобы получить информацию из секрета и подключиться к кластеру Managed Service for PostgreSQL, выполните следующие действия:

  1. Подготовьте инфраструктуру.
  2. Настройте права доступа к секрету пользователя.
  3. Подготовьте PySpark-задание.
  4. Запустите задание и проверьте результат.

Если созданные ресурсы вам больше не нужны, удалите их.

Перед началом работыПеред началом работы

Зарегистрируйтесь в Yandex Cloud и создайте платежный аккаунт:

  1. Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь.
  2. На странице Yandex Cloud Billing убедитесь, что у вас подключен платежный аккаунт, и он находится в статусе ACTIVE или TRIAL_ACTIVE. Если платежного аккаунта нет, создайте его и привяжите к нему облако.

Если у вас есть активный платежный аккаунт, вы можете создать или выбрать каталог, в котором будет работать ваша инфраструктура, на странице облака.

Подробнее об облаках и каталогах.

Необходимые платные ресурсыНеобходимые платные ресурсы

  • Кластер Yandex Managed Service for Apache Spark™: вычислительные ресурсы компонентов кластера (см. тарифы Yandex Managed Service for Apache Spark™).
  • Кластер Managed Service for PostgreSQL: использование выделенных хостам вычислительных ресурсов, объем хранилища и резервных копий (см. тарифы Managed Service for PostgreSQL).
  • Бакет Object Storage: использование хранилища и выполнение операций с данными (см. тарифы Object Storage).
  • NAT-шлюз: почасовое использование шлюза и исходящий через него трафик (см. тарифы Virtual Private Cloud).
  • Публичные IP-адреса, если для хостов кластера включен публичный доступ (см. тарифы Virtual Private Cloud).

Использование секретов Yandex Lockbox, созданных с помощью Connection Manager, не тарифицируется.

Подготовьте инфраструктуруПодготовьте инфраструктуру

  1. Создайте сервисный аккаунт spark-agent и назначьте ему роли:

    • managed-spark.integrationProvider — для взаимодействия Yandex Managed Service for Apache Spark™ с другими сервисами;
    • storage.editor — для доступа к файлу с PySpark-заданием в бакете Object Storage.
  2. Создайте бакет.

  3. Предоставьте разрешение READ для сервисного аккаунта spark-agent на созданный бакет.

  4. Создайте облачную сеть с именем spark-network.

    Вместе с ней автоматически будут созданы три подсети в разных зонах доступности.

  5. В сети spark-network создайте группу безопасности spark-sg для кластера Yandex Managed Service for Apache Spark™, разрешающую исходящие TCP-подключения:

    • на порт 6432 для подключения к PostgreSQL;
    • на порт 443 для скачивания Maven-пакетов.
  6. В сети spark-network создайте группу безопасности pg-sg для кластера Managed Service for PostgreSQL, разрешающую входящие TCP-подключения на порт 6432.

  7. Создайте кластер Yandex Managed Service for Apache Spark™ со следующими настройками:

    • Сервисный аккаунт — spark-agent.
    • Сеть — spark-network.
    • Группа безопасности — spark-sg.
  8. Настройте NAT-шлюз для подсети, в которой создан кластер Yandex Managed Service for Apache Spark™. NAT-шлюз нужен для скачивания JDBC-драйвера PostgreSQL из Maven-репозитория.

  9. Создайте кластер Managed Service for PostgreSQL со следующими настройками:

    • Сеть — spark-network.
    • Группа безопасности — pg-sg.

Настройте права доступа к секрету пользователя Managed Service for PostgreSQLНастройте права доступа к секрету пользователя Managed Service for PostgreSQL

Консоль управления
CLI
  1. В консоли управления перейдите в каталог, в котором создана необходимая инфраструктура.

  2. Перейдите в сервис Managed Service for PostgreSQL.

  3. Нажмите на имя нужного кластера и выберите вкладку Пользователи.

  4. Нажмите на идентификатор подключения в строке нужного пользователя.

    Откроется страница подключения Connection Manager для выбранного пользователя.

  5. На открывшейся странице нажмите на идентификатор секрета.

    Откроется страница секрета Yandex Lockbox, который хранит пароль пользователя PostgreSQL.

  6. На панели слева выберите раздел Права доступа и нажмите кнопку Назначить роли.

  7. Выберите сервисный аккаунт spark-agent, которому будет предоставлен доступ к секрету.

  8. Нажмите кнопку Добавить роль и выберите lockbox.payloadViewer.

  9. Нажмите кнопку Сохранить.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

Чтобы настроить права доступа к секрету пользователя Managed Service for PostgreSQL:

  1. Получите идентификатор секрета из подключения Connection Manager:

    yc metadata-hub connection-manager connection list \
      --mdb-cluster-id <идентификатор_кластера_PostgreSQL>
    

    Идентификатор кластера можно получить со списком кластеров в каталоге.

  2. Настройте права доступа к секрету пользователя:

    yc lockbox secret add-access-binding <идентификатор_секрета> \
      --role lockbox.payloadViewer \
      --service-account-name spark-agent 
    

    Сервисному аккаунту spark-agent будет предоставлен доступ к секрету пользователя Managed Service for PostgreSQL.

Подготовьте PySpark-заданиеПодготовьте PySpark-задание

  1. Создайте локально файл с именем job-mpg-connection-with-secret.py и скопируйте в него скрипт:

    job-mpg-connection-with-secret.py
    import json
    import os
    import urllib.request
    from pyspark.sql import SparkSession
    
    def get_secret(secret_id: str) -> dict:
        """Получение секрета из Yandex Lockbox."""
        # Получение IAM-токена через metadata service
        metadata_host = os.environ.get("YC_METADATA_ADDR", "169.254.169.254")
        token_url = f"http://{metadata_host}/computeMetadata/v1/instance/service-accounts/default/token"
    
        req = urllib.request.Request(token_url)
        req.add_header("Metadata-Flavor", "Google")
        with urllib.request.urlopen(req, timeout=10) as resp:
            token = json.loads(resp.read())["access_token"]
    
        # Получение секрета Yandex Lockbox
        secret_url = f"https://payload.lockbox.api.cloud.yandex.net/lockbox/v1/secrets/{secret_id}/payload"
        req = urllib.request.Request(secret_url)
        req.add_header("Authorization", f"Bearer {token}")
        with urllib.request.urlopen(req, timeout=30) as resp:
            payload = json.loads(resp.read())
            return {e["key"]: e["textValue"] for e in payload["entries"]}
    
    
    # Использование функции получения секрета
    secrets = get_secret("<идентификатор_секрета>")
    
    # Инициализация Spark сессии
    spark = SparkSession.builder.appName("db-reader").getOrCreate()
    
    # Подключение к кластеру Managed Service for PostgreSQL
    df = spark.read \
        .format("jdbc") \
        .option("url", f"jdbc:postgresql://<FQDN_хоста>:6432/<имя_БД>") \
        .option("driver", "org.postgresql.Driver") \
        .option("user", "<имя_пользователя>") \
        .option("password", secrets["postgresql_password"]) \
        .option("dbtable", "<имя_таблицы>") \
        .load()
    
    # Вывод первых 20 строк таблицы
    df.show()
    
  2. Укажите в файле скрипта следующие параметры:

    • идентификатор секрета;
    • FQDN хоста для подключения к кластеру Managed Service for PostgreSQL;
    • имя базы данных;
    • имя таблицы.

Запустите задание и проверьте результатЗапустите задание и проверьте результат

Консоль управления
CLI
  1. Загрузите в бакет файл job-mpg-connection-with-secret.py.

  2. В кластере Yandex Managed Service for Apache Spark™ создайте задание со следующими параметрами:

    • Тип задания — PySpark.
    • Main python файл – s3a://<имя_бакета>/job-mpg-connection-with-secret.py.
    • Пакеты — org.postgresql:postgresql:42.7.3.
  3. Дождитесь, когда созданное PySpark-задание перейдет в статус Done.

  4. Получите логи выполнения задания.

    В логах задания будет показан вывод строк таблицы, указанной в скрипте.

  1. Загрузите в бакет файл job-mpg-connection-with-secret.py:

    yc storage s3api put-object \
      --body <путь_к_локальному_файлу> \
      --bucket <имя_бакета> \
      --key "job-mpg-connection-with-secret.py"
    
  2. Запустите задание:

    yc managed-spark job create-pyspark \
      --cluster-id <идентификатор_кластера> \
      --name "<имя_задания>" \
      --main-python-file-uri s3a://<имя_бакета>/job-mpg-connection-with-secret.py \
      --packages org.postgresql:postgresql:42.7.3
    

    Идентификатор кластера можно получить со списком кластеров в каталоге.

    Команда вернет идентификатор задания. Сохраните его, он понадобится для получения логов выполнения задания.

  3. Получите логи выполнения задания:

    yc managed-spark job log <идентификатор_задания> \
      --cluster-id <идентификатор_кластера>
    

    В логах задания будет показан вывод строк таблицы, указанной в скрипте.

Удалите созданные ресурсыУдалите созданные ресурсы

Некоторые ресурсы платные. Чтобы за них не списывалась плата, удалите ресурсы, которые вы больше не будете использовать:

  1. Кластер Yandex Managed Service for Apache Spark™.
  2. Кластер Managed Service for PostgreSQL.
  3. Бакет Object Storage. Перед удалением бакета удалите из него все объекты.
  4. NAT-шлюз.

Была ли статья полезна?

Предыдущая
Безопасная передача пароля в скрипт инициализации
Следующая
Квоты и лимиты
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»