Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Managed Service for Apache Spark™
  • Начало работы
    • Все инструкции
      • Информация об имеющихся кластерах
      • Создание кластера
      • Подключение к кластеру
      • Изменение кластера
      • Остановка и запуск кластера
      • Удаление кластера
  • Управление доступом
  • Правила тарификации
  • Метрики Yandex Monitoring
  • Справочник Terraform
  • История изменений
  1. Пошаговые инструкции
  2. Кластеры
  3. Подключение к кластеру

Подключение к кластеру Apache Spark™

Статья создана
Yandex Cloud
Обновлена 18 ноября 2025 г.

В этом разделе представлены настройки для подключения к кластеру Yandex Managed Service for Apache Spark™ с помощью Spark Connect.

Подключение с помощью Spark ConnectПодключение с помощью Spark Connect

  1. Создайте IAM-токен и сохраните его в переменной окружения:

    export TOKEN=$(yc iam create-token)
    
  2. Создайте задание SparkConnect без указания параметров в вашем кластере.

  3. Скопируйте эндпоинт Spark Connect Server созданного задания для подключения.

    Эндпоинт можно получить с информацией о задании. Его значение указано в поле URL подключения в консоли управления или в поле connect_url в CLI и API.

  4. Установите пакет pyspark и необходимые зависимости в вашем окружении с помощью менеджера пакетов pip.

    Примечание

    В настоящее время поддерживается подключение только с версией PySpark 3.5.6.

  5. Выполните код для подключения к кластеру:

    import os
    from pyspark.sql import SparkSession
    
    url_spark = "<эндпоинт_для_подключения_к_кластеру>"
    TOKEN = os.environ.get("TOKEN")
    
    spark = SparkSession.builder.remote(f"{url_spark}/;use_ssl=true;token={TOKEN}").getOrCreate()
    df = spark.createDataFrame([(1, "Sarah"), (2, "Maria")]).toDF(*["id", "name"])
    df.show()
    

    Результат:

    +---+-----+
    | id| name|
    +---+-----+
    |  1|Sarah|
    |  2|Maria|
    +---+-----+
    

Была ли статья полезна?

Предыдущая
Создание кластера
Следующая
Изменение кластера
Проект Яндекса
© 2025 ООО «Яндекс.Облако»