Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Query
    • Обзор
    • Термины и определения
    • Квоты и лимиты
    • Обработка запроса
    • Единый анализ потоковых и аналитических данных
    • Резервное копирование
  • Управление доступом
  • Правила тарификации
  • Интеграции
  • Аудитные логи Audit Trails
  • Вопросы и ответы
  • Публичные материалы
  • Обучающие курсы

В этой статье:

  • Модуль аналитической обработки
  • Модуль потоковой обработки
  • Примеры использования
  1. Концепции
  2. Обработка запроса

Обработка запроса

Статья создана
Yandex Cloud
Обновлена 19 февраля 2025 г.
  • Модуль аналитической обработки
  • Модуль потоковой обработки
  • Примеры использования

Yandex Query является массивно-параллельной системой и состоит из двух модулей: модуля аналитической обработки и модуля потокового анализа. Оба модуля хранят данные в единой метабазе запросов. Запрос может быть аналитическим или потоковым. В зависимости от типа запроса выбирается среда исполнения.

query-processing

Модуль исполнения разбивает запрос на этапы, каждый из которых выполняет свою функцию. Чем более сложный запрос, тем большее число этапов участвует в исполнении.

yq-stages

Модуль аналитической обработкиМодуль аналитической обработки

После получения аналитического запроса происходит его разделение на набор независимых этапов, которые распределяются по большому числу серверов для исполнения. Число этапов выбирается Yandex Query автоматически на основании анализа объема данных. Все вычисления в процессе обработки производятся в памяти, никакие данные на диск при этом не сохраняются.

На данный момент модуль аналитической обработки может получать данные из:

  • Yandex Object Storage.

Так как исполнение запросов производится в памяти, то существуют ограничения на максимальный объем данных, участвующих в запросах с агрегациями данных (GROUP BY) или с объединениями данных (JOIN).

Для исполнения аналитических запросов используются общие мощности из всего кластера. Эти мощности используются на время обработки запроса, после чего освобождаются. Если одновременно запущено много аналитических запросов с обработкой больших объемов данных, новые запросы в это время могут получать ошибки, связанных с нехваткой ресурсов. Такие ситуации редки, обычно достаточно повторить запуск запроса для начала его работы.

Модуль потоковой обработкиМодуль потоковой обработки

Для потоковой обработки данные считываются из шины потоков данных и, аналогично модулю аналитической обработки, разделяются на независимые этапы, которые распределяются по серверам. Количество этапов выполняется на основе анализа мощности потока данных. Все вычисления в процессе обработки производятся в памяти, никакие данные на диск при этом не сохраняются.

Зачастую в потоках данных передается только набор изменений из системы-источника. Этого набора изменений может быть недостаточно для обработки запроса и принятия решений, поэтому для расширения семантики обрабатываемых данных используются справочники. Справочники — это статические наборы информации, позволяющие обогатить потоковые данные.

На данный момент модуль потоковой обработки может получать данные из:

  • Yandex Data Streams.

Справочники могут храниться в:

  • Yandex Object Storage.

В рамках защиты от перегрузки системы происходит автоматическое масштабирование вычислений и обработка нехватки памяти. Для защиты от сбоев происходит периодическое сохранение текущего состояния вычислений во внешнюю систему хранения.

Примеры использованияПримеры использования

  • Обработка аудитных логов Yandex Audit Trails.
  • Обработка логов Yandex Cloud Logging.
  • Обработка потока изменений Debezium.
  • Обработка файлов детализации в сервисе Yandex Cloud Billing.

Была ли статья полезна?

Предыдущая
Квоты и лимиты
Следующая
Описание
Проект Яндекса
© 2025 ООО «Яндекс.Облако»