Yandex Query
Сервис обработки данных из Object Storage, PostgreSQL, ClickHouse® и других источников. Благодаря MPP‑архитектуре (Massively Parallel Processing) сервис эластично масштабируется для работы с любым объёмом информации. Позволяет обрабатывать данные с помощью YQL — диалекта SQL.
Yandex Query поможет упростить обработку данных за счёт бессерверных вычислений, высокой скорости работы и нативной интеграции с Yandex Cloud
Межсистемная аналитика
С помощью Yandex Query выполняйте федеративные запросы сразу к Object Storage, PostgreSQL и ClickHouse®, агрегируйте полученные результаты и обрабатывайте их как единое целое.
Потоковая обработка данных
Потоковая обработка основана на группирующих оконных функциях, которые получают потоки данных, группируют их по источникам и временным окнам, после чего выполняют расчёты, а результаты исполнения отправляют во внешние системы.
Аналитические запросы к S3
С помощью аналитических запросов в Yandex Query вы сможете получать данные из Yandex Object Storage в форматах JSON, CSV, TSV, Parquet и др.
Полностью управляемый сервис
Все необходимые ресурсы для исполнения запросов выделяются в момент их запуска и освобождаются после завершения, а сами запросы начинают исполняться сразу же.
Универсальные запросы
Используйте один и тот же разработанный запрос для сценариев аналитики данных, которые хранятся в Yandex Object Storage, и аналитики данных в режиме реального времени.
Интеграция с сервисами Yandex Cloud
Выполняйте запросы к объектному хранилищу Object Storage, потокам данных реального времени Data Streams и агрегируйте результаты выполнения запросов между этими системами.
С чего начать
С чего начать
Создайте подключение к источнику, укажите схему и выполняйте запросы.
Посмотрите вебинар
Посмотрите вебинар
Вебинар будет полезен тем, кто уже обрабатывает данные в Object Storage или только собирается познакомиться с этим хранилищем, особенностями его работы и сервисом Yandex Query.
Научим работать с сервисом
На курсе «Инженер облачных сервисов» вы научитесь создавать отказоустойчивые облачные системы, работать с управляемыми базами данных и контейнерами, изучите основы бессерверных технологий и подходы к созданию защищённой от внешних атак облачной инфраструктуры.
Вопросы и ответы
Yandex Query объединяет возможности виртуализации данных и систему потоковой аналитики реального времени. Такая архитектура системы называется Unified Lambda. В модели Unified Lambda используется единый текст SQL-запроса для обработки потоковых данных и данных, хранимых в различных классах систем хранения.
Начните пользоваться Yandex Query
Полезные ссылки
Debezium является зарегистрированным товарным знаком Red Hat, Inc в США и/или других странах.
ClickHouse является зарегистрированным товарным знаком ClickHouse, Inc.