Yandex Cloud
Поиск
Связаться с намиПопробовать бесплатно
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2026 ООО «Яндекс.Облако»
Yandex Query
    • Обзор
    • Аналитическая обработка
    • Потоковая обработка
    • Единый анализ потоковых и аналитических данных
  • Управление доступом
  • Правила тарификации
  • Интеграции
  • Аудитные логи Audit Trails
  • Вопросы и ответы
  • Публичные материалы
  • Обучающие курсы

В этой статье:

  • Подготовьтесь к работе
  • Создайте поток данных
  • Настройте генерацию данных
  • Выполните запрос
  • Исследуйте результат
  • См. также
  1. Начало работы
  2. Потоковая обработка

Потоковая обработка данных из Yandex Data Streams

Статья создана
Yandex Cloud
Обновлена 13 января 2026 г.
  • Подготовьтесь к работе
  • Создайте поток данных
  • Настройте генерацию данных
  • Выполните запрос
  • Исследуйте результат
  • См. также

В этом примере вы выполните потоковую обработку данных о поездках Нью-Йоркского такси. Данные для примера будут записаны с помощью генератора в специально созданный поток Yandex Data Streams.

В результате вы получите общую стоимость первых 10 поездок после начала обработки потоковых данных.

Для выполнения примера:

  1. Подготовьтесь к работе.
  2. Создайте поток данных.
  3. Настройте генерацию данных.
  4. Выполните запрос.
  5. Исследуйте результат.

Примечание

Yandex Cloud предоставляет набор данных - поездки Нью-Йоркского такси - на условиях “как есть” (as is). Yandex Cloud не дает никаких заверений, явных или подразумеваемых, гарантий или условий в отношении использования вами указанного датасета (набора данных). В пределах, разрешенных вашим местным законодательством, Yandex Cloud не несет никакой ответственности за любые убытки или ущерб, включая прямые, побочные, специальные, косвенные, случайные или штрафные, возникшие в результате использования вами датасета.

NYC Taxi and Limousine Commission (TLC):

Данные были собраны и предоставлены NYC Taxi and Limousine Commission (TLC) поставщиками технологий, уполномоченными в рамках Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP). Данные о поездке не были созданы TLC, и TLC не делает никаких заявлений относительно точности этих данных.

Ознакомьтесь с источником датасета и правилами его использования.

Подготовьтесь к работеПодготовьтесь к работе

  1. Войдите в консоль управления или зарегистрируйтесь. Если вы еще не зарегистрированы, перейдите в консоль управления и следуйте инструкциям.
  2. На странице Yandex Cloud Billing убедитесь, что у вас подключен платежный аккаунт и он находится в статусе ACTIVE или TRIAL_ACTIVE. Если платежного аккаунта нет, создайте его.
  3. Если у вас еще нет каталога, создайте его.
  4. Подключение к потоку данных будет выполняться от имени сервисного аккаунта. Создайте сервисный аккаунт с именем datastream-connection-account и ролью ydb.editor.
  5. Потоки данных используют Yandex Managed Service for YDB. Создайте бессерверную базу данных.

Создайте поток данныхСоздайте поток данных

  1. В консоли управления выберите каталог, в котором нужно создать поток данных.
  2. Перейдите в сервис Data Streams.
  3. Нажмите кнопку Создать поток.
  4. Укажите базу данных Yandex Managed Service for YDB, созданную ранее.
  5. Введите имя потока данных: yellow-taxi.
  6. Нажмите кнопку Создать.

Настройте генерацию данныхНастройте генерацию данных

  1. Создайте соединение:

    1. В консоли управления выберите каталог, в котором нужно создать соединение.
    2. Перейдите в сервис Yandex Query.
    3. На панели слева выберите Учебник.
    4. Перейдите в Потоковый раздел.
    5. В блоке Создать инфраструктуру для обучения нажмите кнопку Создать соединение.
    6. В открывшемся окне в блоке Параметры типа соединения выберите базу данных и сервисный аккаунт, созданные ранее.
    7. Нажмите кнопку Создать.
  2. Создайте привязку к данным:

    1. Откроется страница для создания привязки к данным.
    2. В блоке Параметры привязки к данным выберите поток yellow-taxi, созданный ранее.
    3. Нажмите кнопку Создать.

Запустится генерация данных в поток yellow-taxi. Для управления генератором данных используйте кнопки Стоп и Старт.

Выполните запросВыполните запрос

  1. В редакторе запросов в интерфейсе Query нажмите кнопку Новый потоковый запрос.

  2. В текстовом поле введите текст запроса:

    $data = 
    SELECT 
        *
    FROM
        bindings.`tutorial-streaming` LIMIT 10;
    
    SELECT
        HOP_END() AS time,
        COUNT(*) AS ride_count,
        SUM(total_amount) AS total_amount
    FROM 
        $data
    GROUP BY 
        HOP(CAST(tpep_pickup_datetime AS Timestamp), "PT1M", "PT1M", "PT1M");
    
  3. Нажмите кнопку Выполнить.

Исследуйте результатИсследуйте результат

После выполнения запроса станет доступен результат — общая стоимость total_amount первых 10 поездок, совершенных после запуска запроса.

# time ride_count total_amount
1 2022-11-28T16:05:00.000000Z 10 5675.542679843059

См. такжеСм. также

  • Оператор HOP. Параметры окон в потоковой обработке данных
  • Агрегатные функции. Синтаксис YQL
  • Формат SQL-выражения
  • Потоковый анализ данных

Была ли статья полезна?

Предыдущая
Аналитическая обработка
Следующая
Единый анализ потоковых и аналитических данных
Проект Яндекса
© 2026 ООО «Яндекс.Облако»