Логи в Yandex Data Processing
Собирает и отображает логи кластера Yandex Data Processing сервис Yandex Cloud Logging.
Все отправляемые кластером записи логов содержат стандартные параметры для фильтрации:
resource_type
— всегда принимает значениеdataproc.cluster
;resource_id
— идентификатор кластера.
Также записи логов Yandex Data Processing содержат дополнительные параметры:
hostname
— FQDN хоста;log_type
— тип записи логов кластера.
Типы записей логов Yandex Data Processing
Логи компонентов кластера
В зависимости от роли подкластера, для логов компонентов используются перечисленные типы записей:
-
Все хосты кластера:
cloud-init
— кластеры Yandex Data Processing с версией образа 2.0 или выше;salt-minion
— лог сервисной инициализации кластера Yandex Data Processing;syslog
— системный лог;telegraf
— лог отправки метрик кластера Yandex Data Processing в сервис Monitoring.
-
Хост-мастер:
flume
— кластеры Yandex Data Processing с версией образа ниже 2.0;hadoop-hdfs-namenode
;hadoop-hdfs-secondarynamenode
;hadoop-mapreduce
;hadoop-yarn-resourcemanager
;hadoop-yarn-timelineserver
;hbase-master
;hbase-rest
;hbase-thrift
;hive-metastore
;hiveserver2
;hive-webhcat-console
— кластеры Yandex Data Processing с версией образа ниже 2.0;hive-webhcat-console-error
— кластеры Yandex Data Processing с версией образа ниже 2.0;hive-webhcat
— кластеры Yandex Data Processing с версией образа ниже 2.0;knox
— кластеры Yandex Data Processing с версией образа ниже 2.0;livy-out
;livy-request
;oozie
;oozie-audit
;oozie-error
;oozie-instrumentation
;oozie-jetty
;oozie-jpa
;oozie-ops
;postgres
;sqoop
— кластеры Yandex Data Processing с версией образа ниже 2.0;supervisor
— кластеры Yandex Data Processing с версией образа ниже 2.0;yandex-dataproc-agent
;zeppelin
;zookeeper
.
-
Хосты подкластеров для хранения данных:
hadoop-hdfs-datanode
;hadoop-yarn-nodemanager
.
-
Хосты подкластеров для обработки данных содержат логи
hadoop-yarn-nodemanager
.
Логи заданий
В логах заданий отражаются следующие типы записей:
-
Записи логов YARN-контейнеров.
Для типа записи указывается
containers
.Записи дополняются тегами:
-
yarn_log_type
— имя файла лога, который YARN сохраняет в качестве лога контейнера.Примеры:
stdout
stderr
launch_container.sh
prelaunch.out
directory.info
-
container_id
— идентификатор YARN контейнера. Пример:container_1638976919626_0002_01_000001
. -
application_id
— идентификатор YARN приложения. Пример:application_1638976919626_0002
.
-
-
Записи лога вывода запускающего процесса. Сохраняются в случае запуска задания через API Yandex Data Processing, а не на хостах кластера.
Для типа записи указывается
job_output
.Записи содержат тег
job_id
с идентификатором задания, созданного через API Yandex Data Processing. Если задание начало исполняться и не было завершено на этапе валидации, то записи содержат тегapplication_id
.