Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • AI Studio
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex Data Transfer
  • Доступные трансферы
  • Начало работы
    • Все инструкции
    • Подготовка к трансферу
      • Управление эндпоинтами
      • Миграция эндпоинтов в другую зону доступности
        • Источник
        • Приемник
    • Управление трансфером
    • Работа с базами данных во время трансфера
    • Мониторинг состояния трансфера
  • Решение проблем
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • Публичные материалы
  • Обучающие курсы

В этой статье:

  • Сценарии передачи данных из Managed Service for YDB
  • Подготовка базы данных источника
  • Настройка эндпоинта-источника Managed Service for YDB
  • Настройка приемника данных
  • Решение проблем, возникающих при переносе данных
  • Прерывание трансфера с ошибкой
  1. Пошаговые инструкции
  2. Настройка эндпоинтов
  3. YDB
  4. Источник

Передача данных из эндпоинта-источника Managed Service for YDB

Статья создана
Yandex Cloud
Обновлена 4 июня 2025 г.
  • Сценарии передачи данных из Managed Service for YDB
  • Подготовка базы данных источника
  • Настройка эндпоинта-источника Managed Service for YDB
  • Настройка приемника данных
  • Решение проблем, возникающих при переносе данных
    • Прерывание трансфера с ошибкой

Важно

Этот документ не применим для пользователей Yandex Cloud в регионе Казахстан. См. полный перечень поддерживаемых эндпоинтов в Data Transfer.

С помощью сервиса Yandex Data Transfer вы можете переносить данные из базы Managed Service for YDB и реализовывать различные сценарии переноса, обработки и трансформации данных. Для реализации трансфера:

  1. Ознакомьтесь с возможными сценариями передачи данных.
  2. Подготовьте базу данных Managed Service for YDB к трансферу.
  3. Настройте эндпоинт-источник в Yandex Data Transfer.
  4. Настройте один из поддерживаемых приемников данных.
  5. Создайте и запустите трансфер.
  6. Выполняйте необходимые действия по работе с базой и контролируйте трансфер.
  7. При возникновении проблем, воспользуйтесь готовыми решениями по их устранению.

Сценарии передачи данных из Managed Service for YDBСценарии передачи данных из Managed Service for YDB

  1. Захват изменений данных — это процесс отслеживания изменений в базе данных и поставка этих изменений потребителям. Применяется для приложений, которые чувствительны к изменению данных в реальном времени.

    • Захват изменений из PostgreSQL и поставка в YDS;
    • Захват изменений из PostgreSQL и поставка в Apache Kafka®.
  2. Загрузка данных в витрины — процесс трансфера подготовленных данных в хранилища с целью последующей визуализации.

    • Загрузка данных из YDB в витрину ClickHouse®.
  3. Загрузка данных в масштабируемое хранилище Object Storage позволяет удешевить хранение и облегчает обмен данных с контрагентами.

    • Загрузка данных из YDB в Object Storage.

Подробное описание возможных сценариев передачи данных в Yandex Data Transfer см. в разделе Практические руководства.

Подготовка базы данных источникаПодготовка базы данных источника

Если вы выбрали режим базы данных Dedicated, создайте и настройте группу безопасности в сети, где находится БД.

Настройка эндпоинта-источника Managed Service for YDBНастройка эндпоинта-источника Managed Service for YDB

При создании или изменении эндпоинта вы можете задать:

  • Настройки подключения к базе данных Yandex Managed Service for YDB. Эти параметры обязательные.
  • Список путей для переноса (таблицы, директории).

Важно

Для создания или редактирования эндпоинта управляемой базы данных вам потребуется роль ydb.viewer или примитивная роль viewer, выданная на каталог кластера этой управляемой базы данных.

Консоль управления
Terraform
  • База данных — выберите из списка базу данных Managed Service for YDB.

  • Идентификатор сервисного аккаунта — выберите или создайте сервисный аккаунт с ролью ydb.editor, от имени которого сервис Data Transfer будет подключаться к базе.

  • Группы безопасности — выберите облачную сеть для размещения эндпоинта и группы безопасности для сетевого трафика.

    Это позволит применить к ВМ и кластерам в выбранной сети указанные правила групп безопасности без изменения настроек этих ВМ и кластеров. Подробнее см. в разделе Сеть в Yandex Data Transfer.

  • Список включенных путей — добавьте пути к таблицам или директориям Managed Service for YDB, которые необходимо перенести.

    Имена таблиц и директорий должны соответствовать правилам именования идентификаторов в YDB. Экранирование двойных кавычек не требуется. В пути в качестве разделителя используется символ /. Подробнее читайте в документации YDB.

    Добавление новых путей при редактировании эндпоинта, использующегося в трансферах типа Копирование и репликация в статусе Реплицируется, не приведет к загрузке истории данных таблиц. Чтобы добавить таблицу с ее историческими данными, используйте поле Список объектов для переноса в параметрах трансфера.

    Для трансферов типа Копирование можно не указывать пути, в таком случае будут перенесены все таблицы.

    Для трансферов типа Репликация или Копирование и репликация обязательно указывать пути, в том числе и при репликации всех таблиц.

  • Название предсозданного changefeed — укажите название потока изменений, если он уже создан. В противном случае оставьте это поле пустым.

  • Название предсозданного consumer — укажите потребителя данных (consumer), которого вы создали для потока изменений. По умолчанию используется потребитель с именем __data_transfer_consumer.

    Примечание

    Если указан потребитель данных, то для подключения трансфера к YDB сервисному аккаунту, указанному в настройках эндпоинта, достаточно роли ydb.viewer. Если потребитель данных не указан, сервисному аккаунту требуется роль ydb.editor, чтобы создать потребителя по умолчанию.

  • Настройки параллельного копирования:

    • Использовать шардированный снапшот — включите, чтобы ускорить трансфер с помощью шардированного снапшота.

      Во время стадии копирования таблицы делятся на партиции. Копирование будет выполняться быстрее, если количество воркеров, умноженное на количество потоков внутри воркера, будет пропорционально количеству партиций.

    • Имя папки для копий — укажите имя папки, где во время стадии копирования будут храниться копии переносимых таблиц. Папка создается в корневой директории базы-источника и по умолчанию называется data-transfer. Копии таблиц в папке содержат только метаданные, поэтому занимают незначительный объем памяти. Когда стадия копирования завершится, папка будет удалена.

    Для управления параллельным копированием у сервисного аккаунта, указанного в настройках эндпоинта, должна быть роль ydb.editor.

    Чтобы добиться максимальной скорости при параллельном копировании:

    • В параметрах эндпоинта-источника включите опцию Использовать шардированный снапшот.

    • В параметрах трансфера, в блоке Настройки параллельного копирования, задайте число воркеров и потоков в каждом воркере так, чтобы общее число потоков было равно числу партиций. Например, чтобы быстрее скопировать таблицу, разбитую на 6 партиций, можно задать 3 воркера и 2 потока внутри каждого воркера.

    Подробнее о параллельном копировании.

  • Тип эндпоинта — ydb_source.
  • name — имя эндпоинта Managed Service for YDB.

  • database — путь к базе данных Managed Service for YDB.

    Вы можете посмотреть путь к БД в консоли управления на странице с информацией о БД YDB.

    Пример пути к БД: /ru-central1/b1gia87mbaom********/etnudu2n9ri3********.

  • service_account_id — сервисный аккаунт с ролью ydb.editor, от имени которого сервис Data Transfer будет подключаться к базе данных.

  • paths - список путей к таблицам или директориям Managed Service for YDB, которые необходимо перенести.

    Имена таблиц и директорий должны соответствовать правилам именования идентификаторов в YDB. Экранирование двойных кавычек не требуется. В пути в качестве разделителя используется символ /. Подробнее читайте в документации YDB.

    Для трансферов типа Репликация или Копирование и репликация обязательно указывать пути, в том числе и при репликации всех таблиц. Для трансферов типа Копирование можно не указывать пути, в таком случае будут перенесены все таблицы.

    Добавление новых путей при редактировании эндпоинта, использующегося в трансферах типа Копирование и репликация в статусе Реплицируется, не приведет к загрузке истории данных таблиц. Чтобы добавить таблицу с ее историческими данными, используйте поле Список объектов для переноса в параметрах трансфера.

  • security_groups — группы безопасности для сетевого трафика.

    Правила групп безопасности применяются к трансферу. Они позволяют открыть сетевой доступ с ВМ трансфера к кластеру. Подробнее см. в разделе Сеть в Yandex Data Transfer.

    Группы безопасности должны принадлежать той же сети, в которой размещен кластер.

    Примечание

    В Terraform сеть для групп безопасности задавать не нужно.

  • changefeed_custom_name — укажите здесь название потока изменений, если он уже создан. В противном случае не указывайте этот параметр.

Пример структуры конфигурационного файла (приведены не все параметры):

resource "yandex_datatransfer_endpoint" "ydb-source" { 
  name = "<имя_эндпоинта>"
  settings {
    ydb_source {
      database               = "<имя_БД_YDB>"        
      service_account_id     = "<идентификатор_сервисного_аккаунта>"
      paths                  = ["<список_путей_к_переносимым_объектам_YDB>"]
      changefeed_custom_name = "<имя_потока_изменений>"
    }
  }
}

Подробнее см. в документации провайдера Terraform.

Настройка приемника данныхНастройка приемника данных

Настройте один из поддерживаемых приемников данных:

  • ClickHouse®;
  • Yandex Object Storage;
  • Apache Kafka®;
  • YDS;
  • Yandex Managed Service for YDB.

Полный список поддерживаемых источников и приемников в Yandex Data Transfer см. в разделе Доступные трансферы.

После настройки источника и приемника данных создайте и запустите трансфер.

Решение проблем, возникающих при переносе данныхРешение проблем, возникающих при переносе данных

Известные проблемы, связанные с использованием эндпоинта Managed Service for YDB:

Прерывание трансфера с ошибкойПрерывание трансфера с ошибкой

Трансфер типа Репликация или Копирование и репликация прерывается с ошибкой.

Текст ошибки:

/Ydb.PersQueue.V1.PersQueueService/AddReadRule failed: OVERLOADED

Трансфер прерывается из-за ограничения облачной квоты на количество операций с Managed Service for YDB.

Решение:

  1. Увеличьте в квотах Managed Service for YDB на облако с нужной базой данных значение характеристики Количество схемных операций в минуту и активируйте трансфер повторно.

См. полный список рекомендаций в разделе Решение проблем.

Была ли статья полезна?

Предыдущая
Приемник
Следующая
Приемник
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»