Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Data Processing
  • Начало работы
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • Вопросы и ответы
  • Обучающие курсы

В этой статье:

  • Перед началом работы
  • Создайте кластер
  • Подключитесь к кластеру
  • Подключитесь к интерфейсам компонентов
  • Что дальше

Как начать работать с Yandex Data Processing

Статья создана
Yandex Cloud
Улучшена
Danila N.
Обновлена 27 февраля 2025 г.
  • Перед началом работы
  • Создайте кластер
  • Подключитесь к кластеру
  • Подключитесь к интерфейсам компонентов
  • Что дальше

Чтобы начать работу с сервисом:

  1. Создайте кластер.
  2. Подключитесь к кластеру.
  3. Подключитесь к интерфейсам компонентов.

Перед началом работыПеред началом работы

  1. Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы.

  2. Если у вас еще нет каталога, создайте его:

    1. В консоли управления в списке слева выберите нужное облако.

    2. Справа сверху нажмите кнопку Создать каталог.

    3. Введите имя каталога. Требования к имени:

      • длина — от 2 до 63 символов;
      • может содержать строчные буквы латинского алфавита, цифры и дефисы;
      • первый символ — буква, последний — не дефис.
    4. (Опционально) Введите описание каталога.

    5. Выберите опцию Создать сеть по умолчанию. Будет создана сеть с подсетями в каждой зоне доступности. Также в этой сети будет создана группа безопасности по умолчанию, внутри которой весь сетевой трафик разрешен.

    6. Нажмите кнопку Создать.

  3. Назначьте вашему аккаунту в Yandex Cloud роли:

    • dataproc.editor — чтобы создать кластер;
    • vpc.user — чтобы работать с сетью кластера;
    • iam.serviceAccounts.user — чтобы привязать сервисный аккаунт к кластеру и создавать ресурсы от имени этого сервисного аккаунта.

    Примечание

    Если вы не можете управлять ролями, обратитесь к администратору вашего облака или организации.

  4. Настройте NAT-шлюз в подсети, в которой будет размещен кластер.

  5. Если вы используете группы безопасности, настройте их.

  6. Подключаться к кластеру Yandex Data Processing можно как изнутри, так и извне Yandex Cloud:

    • Чтобы подключиться изнутри Yandex Cloud, создайте виртуальную машину на основе Linux в той же сети, что и кластер.

    • Чтобы подключиться к кластеру из интернета, запросите публичный доступ к подкластерам при создании кластера.

    Примечание

    Следующий шаг предполагает, что подключение к кластеру производится с ВМ на основе Linux.

  7. Подключитесь к ВМ по SSH.

Создайте кластерСоздайте кластер

Чтобы создать кластер:

  1. В консоли управления откройте каталог, в котором нужно создать кластер, и выберите сервис Yandex Data Processing.
  2. Нажмите кнопку Создать кластер.
  3. Задайте параметры кластера и нажмите кнопку Создать кластер. Процесс подробно рассмотрен в разделе Создание кластера.
  4. Дождитесь, когда кластер будет готов к работе: его состояние сменится на Alive. Это может занять некоторое время.

Подключитесь к кластеруПодключитесь к кластеру

Чтобы подключиться к кластеру:

  1. Если вы используете группы безопасности для облачной сети, настройте их так, чтобы был разрешен весь необходимый трафик между кластером и хостом, с которого выполняется подключение.

  2. Скопируйте на ВМ SSL-ключ, который вы указали при создании кластера Yandex Data Processing.

  3. Подключитесь к кластеру по SSH и проверьте, что команды Hadoop выполняются. В зависимости от версии образа, укажите имя пользователя:

    • для версии 2.0 — ubuntu;
    • для версии 1.4 — root.

Подробно процесс подключения к кластеру Yandex Data Processing рассмотрен в разделе Подключение к кластеру.

Подключитесь к интерфейсам компонентовПодключитесь к интерфейсам компонентов

Чтобы подключиться к интерфейсам компонентов Yandex Data Processing по веб-интерфейсу:

  1. Включите настройку UI Proxy в кластере.
  2. Получите список URL интерфейсов.

Чтобы подключиться к интерфейсам компонентов Yandex Data Processing по SSH с перенаправлением портов:

  1. Создайте промежуточную ВМ с публичным IP-адресом в одной сети с кластером и с группой безопасности, в которой разрешены входящий и исходящий трафик через порты компонентов.

  2. Подключитесь к созданной ВМ по SSH с перенаправлением к нужным портам хоста Yandex Data Processing. В зависимости от версии образа, укажите имя пользователя:

    • для версии 2.0 — ubuntu;
    • для версии 1.4 — root.

Подробно процесс подключения к интерфейсам компонентов кластера Yandex Data Processing рассмотрен в разделе Подключение к интерфейсам компонентов.

Что дальшеЧто дальше

  • Изучите концепции сервиса.
  • Узнайте подробнее о создании кластера и работе с заданиями.

Была ли статья полезна?

Следующая
Все инструкции
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»