Мониторинг состояния Spark-приложений
Чтобы оценить работу Spark-приложений в кластере Yandex Data Processing, вы можете проверить:
- список приложений;
- логи приложения;
- очередь выполнения приложений;
- подробную информацию о приложении;
- выделенные для приложения ресурсы;
- кешируемые таблицы;
- список и планы SQL-запросов.
Примечание
Убедитесь, что в кластере включены веб-интерфейсы компонентов. При необходимости, включите их.
Проверить список приложений
- Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. - Нажмите на имя нужного кластера.
- В блоке UI Proxy выберите интерфейс
YARN Resource Manager Web UI
.
Здесь представлена информация обо всех работающих и завершенных приложениях.
Проверить логи приложения
-
Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. -
Нажмите на имя нужного кластера.
-
В блоке UI Proxy выберите интерфейс
YARN Resource Manager Web UI
. -
Найдите нужное приложение и нажмите на его идентификатор в столбце ID.
Откроется окно с информацией о работе приложения и таблицей со списком попыток запуска приложения.
-
Нажмите на ссылку в столбце Logs напротив нужной попытки.
Проверить очередь выполнения приложений
- Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. - Нажмите на имя нужного кластера.
- В блоке UI Proxy выберите интерфейс
YARN Resource Manager Web UI
. - В левом меню перейдите в раздел Scheduler.
В разделе Application Queues графически представлена очередь выполнения приложений и занимаемые ими ресурсы.
Проверить подробную информацию о приложении
-
Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. -
Нажмите на имя нужного кластера.
-
В блоке UI Proxy выберите интерфейс
YARN Resource Manager Web UI
. -
Найдите нужное приложение и перейдите по ссылке в столбце Tracking UI. Название ссылки зависит от статуса приложения:
- ApplicationMaster — для запущенных приложений;
- History — для завершенных приложений.
-
Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. -
Нажмите на имя нужного кластера.
-
В блоке UI Proxy выберите интерфейс
Spark History Server Web UI
.Откроется список завершенных приложений. Чтобы перейти к списку запущенных приложений, внизу таблицы нажмите Show incomplete applications.
-
Найдите нужное приложение и перейдите по ссылке в столбце App ID.
Откроется окно интерфейса Spark History Server Web UI с подробной информацией о выбранном приложении:
- Event Timeline — история выполнения заданий с отметками о выделении и освобождении исполнителей (executors).
- Active Jobs — список заданий, которые выполняются, либо ожидают начала выполнения.
- Completed Jobs — список завершенных заданий.
Для каждого задания в таблице указаны:
- время запуска (Submitted);
- продолжительность выполнения (Duration);
- количество стадий — завершенных/всего (Stages: Succeeded/Total);
- количество операций — завершенных/всего (Tasks: Succeeded/Total).
Проверить выделенные для приложения ресурсы
- Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. - Нажмите на имя нужного кластера.
- В блоке UI Proxy выберите интерфейс
Spark History Server Web UI
. - В верхнем меню перейдите в раздел Executors.
В интерфейсе представлено две таблицы:
- Summary — обобщенная информация о количестве и состоянии исполнителей и используемых ресурсах.
- Executors — информация по каждому исполнителю.
В таблицах приведено:
- количество доступных для каждого исполнителя ресурсов;
- количество выполняемых и завершенных операций (tasks);
- продолжительность выполнения задачи (Task Time) с указанием времени, затраченного на сборку мусора (GC Time).
Совет
Если сборка мусора занимает много времени:
- Убедитесь, что исполнителю выделяется достаточно оперативной памяти.
- Настройте сборщик мусора вручную. Как это сделать см. в документации Apache Spark
.
Проверить кешируемые таблицы
- Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. - Нажмите на имя нужного кластера.
- В блоке UI Proxy выберите интерфейс
Spark History Server Web UI
. - В верхнем меню перейдите в раздел Storage.
В интерфейсе представлен список кешируемых таблиц (RDDs
Чтобы посмотреть детальную статистику, нажмите на имя таблицы.
Проверить список и планы SQL-запросов
- Перейдите на страницу каталога
и выберите сервис Yandex Data Processing. - Нажмите на имя нужного кластера.
- В блоке UI Proxy выберите интерфейс
Spark History Server Web UI
. - В верхнем меню перейдите в раздел SQL.
В таблице представлен список выполненных SQL-запросов с информацией о времени запуска и продолжительности их выполнения.
Чтобы получить план выполнения запроса, нажмите на текст запроса в столбце Description. План выполнения представлен в виде схемы. Чтобы увидеть текстовый вариант плана, нажмите Details в нижней части рисунка.
На плане запроса приведена статистика для каждого оператора, которая отражает количество завершенных операций (tasks) и продолжительность их выполнения. Если запрос еще выполняется, отобразится статистика на текущий момент.