Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Истории успеха
  • Документация
  • Блог
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»
Yandex Query
    • Форматы данных и алгоритмы сжатия
    • Работа с базами данных Managed Service for ClickHouse®
    • Работа с базами данных Yandex MPP Analytics for PostgreSQL
    • Работа с базами данных Managed Service for MySQL®
    • Работа с базами данных Managed Service for PostgreSQL
    • Работа с базами данных Managed Service for YDB
    • Чтение данных из таблиц Iceberg
  • Управление доступом
  • Правила тарификации
  • Интеграции
  • Аудитные логи Audit Trails
  • Вопросы и ответы
  • Публичные материалы
  • Обучающие курсы

В этой статье:

  • Настройка соединения
  • Синтаксис запросов
  • Ограничения
  • Поддерживаемые типы данных
  • Выделение значимой части данных (pruning)
  1. Источники и приемники данных
  2. Чтение данных из таблиц Iceberg

Чтение данных из таблиц Iceberg

Статья создана
Yandex Cloud
Обновлена 26 января 2026 г.
  • Настройка соединения
  • Синтаксис запросов
  • Ограничения
  • Поддерживаемые типы данных
  • Выделение значимой части данных (pruning)

В этом разделе описана основная информация о работе с таблицами Iceberg.

Для чтения данных из таблицы Iceberg, расположенной в Yandex Object Storage, необходимо выполнить следующие шаги:

  1. Создать соединение, содержащее реквизиты для подключения к каталогу Iceberg.
  2. Выполнить запрос к требуемой таблице из каталога.

Пример запроса, выполняющего чтение данных из таблицы Iceberg:

SELECT * FROM iceberg_connection.my_table

Где:

  • iceberg_connection — название созданного соединения с каталогом Iceberg.
  • my_table — имя таблицы в каталоге Iceberg.

Настройка соединенияНастройка соединения

Чтобы создать соединение с каталогом Iceberg:

  1. В консоли управления выберите каталог, в котором нужно создать соединение.

  2. Перейдите в сервис Yandex Query.

  3. На панели слева перейдите на вкладку Соединения.

  4. Нажмите кнопку Создать.

  5. Укажите параметры соединения:

    1. В блоке Общие параметры:

      • Имя — название соединения с каталогом Iceberg.
      • Тип — Iceberg.
    2. В блоке Параметры типа соединения:

      • Аутентификация бакета — выберите Публичный или Приватный в зависимости от типа доступа к чтению объектов в бакете.

        Для публичного бакета введите имя в поле Бакет.
        Для приватного бакета:

        • Выберите Облако и каталог, в котором находится источник данных.

        • Выберите или создайте новый бакет.

        • Выберите или создайте новый сервисный аккаунт с ролью storage.viewer, от имени которого будет осуществляться доступ к данным.

          Чтобы использовать сервисный аккаунт, пользователю нужна роль iam.serviceAccounts.user.

      • Директория — директория с каталогом Hadoop в выбранном бакете.

  6. Нажмите кнопку Создать.

Синтаксис запросовСинтаксис запросов

Для работы с таблицами Iceberg используется следующая форма SQL-запроса:

SELECT * FROM <соединение>.<имя_таблицы>

Где:

  • <соединение> — название созданного соединения с каталогом.
  • <имя_таблицы> — имя таблицы Iceberg из каталога.

ОграниченияОграничения

При работе с таблицами Iceberg существует ряд ограничений:

  • Можно выполнять запросы только к таблицам, созданным в соответствии с версией 1 спецификации Iceberg.
  • Чтение таблиц возможно только из каталога Hadoop, размещенного в Yandex Object Storage.
  • Не поддерживается чтение предыдущих состояний (снапшотов) таблицы (time travel).

Поддерживаемые типы данныхПоддерживаемые типы данных

Перечень поддерживаемых типов данных Iceberg и соответствующие им типы YQL.

Тип данных Iceberg Тип данных Yandex Query
boolean Bool
int Int32
long Int64
float Float
double Double
date Date
time Utf8
timestamp Utf8
string Utf8
binary String

Выделение значимой части данных (pruning)Выделение значимой части данных (pruning)

Запрос к таблице Iceberg может содержать фильтры, которые строятся на основе WHERE-выражения. Эти фильтры используются для сокращения объема данных, требующих обработки. Процедура сокращения называется выделение значимой части данных или отсечение лишних данных (pruning).

Отсечение лишних данных выполняется как на этапе планирования операции чтения, так и на этапе чтения.

На этапе планирования:

  • считывается метаинформация таблицы Iceberg;
  • определяется перечень файлов данных, требующих чтения (на основе статистики из метаданных);
  • передаются отобранные файлы для чтения.

На этапе чтения:

  • файлы данных разбиваются на строковые группы (row groups);
  • считывается статистика для строковых групп (row groups);
  • определяется перечень групп, требующих чтения (на основе статистики);
  • выполняется чтение данных из отобранных групп.

Была ли статья полезна?

Предыдущая
Работа с базами данных Managed Service for YDB
Следующая
Все руководства
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»