Задания в Yandex Data Processing
В кластере Yandex Data Processing можно создавать и выполнять задания (jobs). Это позволяет, например, на регулярной основе загружать набор данных из бакета Object Storage, использовать их в расчетах и формировать аналитику.
Поддерживаются задания следующих типов:
При создании задания указываются:
- Аргументы — значения, используемые основным исполняемым файлом задания.
- Свойства — пары
ключ:значение
, задающие настройки компонентов образа.
Для размещения и запуска задания:
-
Воспользуйтесь интерфейсами Yandex Cloud. Подробнее см. в базовых примерах работы с заданиями.
-
Подключитесь напрямую к узлу кластера. Подробнее см. пример в разделе Запуск заданий с удаленных хостов, не входящих в кластер.
Для успешного выполнения задания:
-
Предоставьте доступ к нужным бакетам Object Storage для сервисного аккаунта кластера.
Рекомендуется использовать минимум два бакета:
- Бакет с правами только на чтение для хранения исходных данных и файлов, необходимых для запуска задания.
- Бакет с правами на чтение и запись для хранения результатов выполнения заданий. Укажите его при создании кластера.
-
Передайте при создании задания все необходимые для его работы файлы.
Если в кластере достаточно вычислительных ресурсов, несколько созданных заданий будут выполняться параллельно. В противном случае из заданий будет сформирована очередь.
Логи заданий
Логи заданий сохраняются в сервисе Yandex Cloud Logging. Подробнее см. в разделе Работа с логами.