Задания в Yandex Data Processing

Статья создана

Обновлена 31 января 2025 г.

В кластере Yandex Data Processing можно создавать и выполнять задания (jobs). Это позволяет, например, на регулярной основе загружать набор данных из бакета Object Storage, использовать их в расчетах и формировать аналитику.

Поддерживаются задания следующих типов:

При создании задания указываются:

Аргументы — значения, используемые основным исполняемым файлом задания.
Свойства — пары ключ:значение, задающие настройки компонентов образа.

Для размещения и запуска задания:

Воспользуйтесь интерфейсами Yandex Cloud. Подробнее см. в базовых примерах работы с заданиями.
Подключитесь напрямую к узлу кластера. Подробнее см. пример в разделе Запуск заданий с удаленных хостов, не входящих в кластер.

Для успешного выполнения задания:

Предоставьте доступ к нужным бакетам Object Storage для сервисного аккаунта кластера.

Рекомендуется использовать минимум два бакета:
- Бакет с правами только на чтение для хранения исходных данных и файлов, необходимых для запуска задания.
- Бакет с правами на чтение и запись для хранения результатов выполнения заданий. Укажите его при создании кластера.
Передайте при создании задания все необходимые для его работы файлы.

Если в кластере достаточно вычислительных ресурсов, несколько созданных заданий будут выполняться параллельно. В противном случае из заданий будет сформирована очередь.

Логи заданий

Логи заданий сохраняются в сервисе Yandex Cloud Logging. Подробнее см. в разделе Работа с логами.

Задания в Yandex Data Processing

Логи заданийЛоги заданий

Была ли статья полезна?

Логи заданий