Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Data Transfer
  • Доступные трансферы
  • Начало работы
    • Все инструкции
    • Подготовка к трансферу
      • Управление эндпоинтами
      • Миграция эндпоинтов в другую зону доступности
        • Источник
        • Приемник
    • Управление трансфером
    • Работа с базами данных во время трансфера
    • Мониторинг состояния трансфера
  • Решение проблем
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • Обучающие курсы

В этой статье:

  • Сценарии передачи данных в YTsaurus с помощью Yandex Data Transfer
  • Настройка источника данных
  • Подготовка базы данных приемника
  • Настройка эндпоинта-приемника YTsaurus
  • Поддерживаемые схемы поставок данных и ограничения
  • Кластер Managed Service for YTsaurus
  • Расширенные настройки
  1. Пошаговые инструкции
  2. Настройка эндпоинтов
  3. YTsaurus
  4. Приемник

Передача данных в эндпоинт-приемник YTsaurus

Статья создана
Yandex Cloud
Обновлена 20 октября 2025 г.
  • Сценарии передачи данных в YTsaurus с помощью Yandex Data Transfer
  • Настройка источника данных
  • Подготовка базы данных приемника
  • Настройка эндпоинта-приемника YTsaurus
    • Поддерживаемые схемы поставок данных и ограничения
    • Кластер Managed Service for YTsaurus
    • Расширенные настройки

С помощью сервиса Yandex Data Transfer вы можете переносить данные в YTsaurus и реализовывать различные сценарии переноса, обработки и трансформации данных.

Для YTsaurus доступны два вида эндпоинтов-приемников:

  • YTSaurus Dynamic — запись данных в динамические таблицы;
  • YTSaurus Static — запись данных в статические таблицы.

Для реализации трансфера:

  1. Ознакомьтесь с возможными сценариями передачи данных.
  2. Настройте один из поддерживаемых источников данных.
  3. Настройте эндпоинт-приемник в Yandex Data Transfer.
  4. Cоздайте и запустите трансфер.
  5. Выполняйте необходимые действия по работе с базой данных и контролируйте трансфер.

Сценарии передачи данных в YTsaurus с помощью Yandex Data TransferСценарии передачи данных в YTsaurus с помощью Yandex Data Transfer

Вы можете реализовывать сценарии загрузки данных из таблиц в управляемые базы данных Yandex Cloud для дальнейшего хранения в облаке, обработки и загрузки в витрины данных для визуализации.

Подробное описание возможных сценариев передачи данных в Yandex Data Transfer см. в разделе Практические руководства.

Настройка источника данныхНастройка источника данных

Настройте один из поддерживаемых источников данных:

  • Apache Kafka® (трансфер возможен только в приемник вида YTSaurus Dynamic);
  • ClickHouse®;
  • Greenplum®;
  • MongoDB;
  • MySQL®;
  • PostgreSQL;
  • Yandex Object Storage;
  • Oracle;
  • Managed Service for YDB.

Полный список поддерживаемых источников и приемников в Yandex Data Transfer см. в разделе Доступные трансферы.

Подготовка базы данных приемникаПодготовка базы данных приемника

  1. Для трансфера в статические таблицы выдайте права на создание и запись в таблицы (разрешение write на директорию с таблицами). Если перед трансфером выполняется очистка данных, выдайте разрешение remove. Также для трансфера потребуется право use на аккаунт, ассоциированный с директорией, в которой будут находиться таблицы.

  2. Для трансфера в динамические таблицы, помимо прав write, remove и use, выдайте разрешение на mount таблиц.

Настройка эндпоинта-приемника YTsaurusНастройка эндпоинта-приемника YTsaurus

При создании или изменении эндпоинта вы можете задать:

  • Настройки подключения к кластеру Yandex Managed Service for YTsaurus. Эти параметры обязательные.
  • Расширенные настройки.

Поддерживаемые схемы поставок данных и ограниченияПоддерживаемые схемы поставок данных и ограничения

Схемы поставок данных Уровень поддержки Ограничения
Поставка данных в статические таблицы Без трансформации данных (шардирования, ротации или разделения таблицы на подтаблицы).
Параллельное копирование в статические таблицы В разработке.
Поставка данных в динамические таблицы через статические Все промежуточные операции над частями таблиц производятся нетранзакционно и видны пользователю.
Ограничения политики очистки Disabled и Drop 1.
Параллельное копирование в динамические таблицы через статические Все промежуточные операции над частями таблиц производятся нетранзакционно и видны пользователю.
Ограничения политики очистки Disabled и Drop 1.

1 Ограничения политики очистки:

  • При использовании политики Disabled не гарантируется, что новые данные в существующих таблицах имеют приоритет над старыми при пересечении ключей.
  • При использовании политики Drop очистка старых таблиц производится до момента добавления частей новых таблиц. Это будет исправлено.

Важно

Для динамических таблиц первичные ключи в данных обязательны. Динамические таблицы YTsaurus хранят данные в формате ключ:значение, где ключ и соответствующее ему значение также обязательно должны быть заданы. При отсутствии значения не ключевых колонок будет создана не ключевая колонка-заглушка __dummy. При отсутствии первичного ключа трансфер завершится с ошибкой.

Кластер Managed Service for YTsaurusКластер Managed Service for YTsaurus

Консоль управления
  • Идентификатор сервисного аккаунта — выберите или создайте сервисный аккаунт с ролью managed-ytsaurus.editor, от имени которого сервис Data Transfer будет подключаться к кластеру.

  • Идентификатор кластера — выберите кластер, к которому необходимо подключиться.

  • Группы безопасности — выберите:

    • облачную сеть для размещения эндпоинта;
    • группы безопасности для сетевого трафика.

    Правила групп безопасности применяются к трансферу. Они позволяют открыть сетевой доступ с ВМ трансфера к кластеру. Подробнее см. в разделе Сеть в Yandex Data Transfer.

  • Путь — путь к папке, в которую будут записываться переносимые трансфером данные.

  • Политика очистки — выберите способ очистки данных в базе-приемнике перед переносом:

    • Drop — полное удаление таблиц, участвующих в трансфере (вариант по умолчанию).

      Используйте эту опцию, чтобы при любой активации трансфера в базу-приемник всегда передавалась самая последняя версия схемы таблиц из источника.

    • Disabled — не очищать.

      Выберите эту опцию, если будет производиться только репликация без копирования данных.

Расширенные настройкиРасширенные настройки

Настройки для типа базы данных YTSaurus DynamicНастройки для типа базы данных YTSaurus Dynamic

Консоль управления
  • Настройки таблицы:

    • Медиум — выберите вид носителя, на котором будут храниться данные:

      • HDD (primary_medium=default) — множество HDD-дисков в кластере;
      • SSD (primary_medium=ssd_blobs) — множество SSD-дисков в кластере;
      • SSD для журналов (primary_medium=ssd_journals) — множество SSD-дисков для хранения журналов динамических таблиц;
      • RAM (primary_medium=in_memory) — выделенное пространство в оперативной памяти узлов кластера.
    • Формат чанка — выберите формат хранения данных в чанке:

      • Поколоночный (optimize_for=scan) — используется для оптимизации сканирования;
      • Построчный (optimize_for=lookup) — используется для оптимизации поиска.
    • Атомарные транзакции — включите, если нужно, чтобы для таблиц транзакции были полностью атомарными (свойство atomicity=full).

    • TTL — укажите срок хранения данных в таблицах. По истечении этого срока данные будут удалены.

    • Пользовательские атрибуты — позволяет добавить пользовательские атрибуты для создаваемых таблиц в формате YSON. Для добавления нового атрибута нажмите кнопку + Атрибут и введите его имя и значение.

  • Настройки процесса записи:

    • Не применять изменения схемы — выберите, чтобы не изменять схему данных на приемнике при изменении ее на источнике. По умолчанию при изменении схемы на источнике трансфер будет автоматически применять изменения схемы в приемнике: создавать новые таблицы, добавлять новые колонки, добавлять новые перечисляемые значения и перечисляемые типы. По умолчанию не применяются такие изменения, как удаление таблиц или колонок.

    • Отбрасывать большие значения — включите для игнорирования некритичных данных, не удовлетворяющих ограничениям. Если размер значения колонки нарушает ограничения YTsaurus, это значение будет заменено на BigStringValueStub.

    • Копирование через статическую таблицу — выберите для выполнения операций копирования через временные статические таблицы. Для политики очистки Drop существующие данные в приемнике будут удалены после завершения копирования. В режиме без очистки будет выполнено слияние новых и существующих данных.

    • Вычислительный пул YT — укажите вычислительный пул, в котором будут запускаться операции над таблицами.

Настройки для типа базы данных YTSaurus StaticНастройки для типа базы данных YTSaurus Static

Консоль управления
  • Настройки таблицы:

    • Формат чанка — выберите формат хранения данных в чанке:

      • Поколоночный (optimize_for=scan) — используется для оптимизации сканирования;
      • Построчный (optimize_for=lookup) — используется для оптимизации поиска.
    • Отсортировать статические таблицы — включите, если нужно, чтобы записи таблицы были отсортированы по ключу.
    • Пользовательские атрибуты — позволяет добавить пользовательские атрибуты для создаваемых таблиц в формате YSON. Для добавления нового атрибута нажмите кнопку + Атрибут и введите его имя и значение.

  • Настройки процесса записи:

    • Отбрасывать большие значения — включите для игнорирования некритичных данных, не удовлетворяющих ограничениям. Если размер значения колонки нарушает ограничения YTsaurus, это значение будет заменено на BigStringValueStub.

    • Вычислительный пул YT — укажите вычислительный пул, в котором будут запускаться операции над таблицами.

После настройки источника и приемника данных создайте и запустите трансфер.

Была ли статья полезна?

Предыдущая
Источник
Следующая
Управление трансфером
Проект Яндекса
© 2025 ООО «Яндекс.Облако»