Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex DataLens
    • Обзор
    • Работа с датасетом
    • Модель данных
    • Настройки датасета
    • Типы данных
    • Соответствие типов данных
  • Аудитные логи Audit Trails

В этой статье:

  • Источник данных
  • Поля данных
  • Агрегация данных
  1. Датасеты
  2. Модель данных

Модель данных в DataLens

Статья создана
Yandex Cloud
Обновлена 11 сентября 2024 г.
  • Источник данных
  • Поля данных
  • Агрегация данных

Набор данных датасета представлен в виде полей.

Источник данныхИсточник данных

В качестве источника данных используются одна или несколько таблиц.

Примечание

Существует ограничение на показ в датасете первых 1000 таблиц из источника. Если нужные таблицы не попали в список, то на данный момент их можно добавить только вручную с помощью SQL-запроса.

Если в источнике доступно несколько таблиц, их можно объединить с помощью оператора JOIN.
Объединение происходит через создание связи. В связи вы указываете поля исходной таблицы и поля таблицы, с которой происходит объединение.

Связь таблиц происходит автоматически по первому совпадению имени полей и типа данных полей.

При этом вы можете:

  • изменять поля в связи;
  • добавлять новые связи или удалять существующие;
  • изменять в связи тип оператора JOIN (INNER, LEFT, RIGHT, FULL);
  • управлять оптимизацией связи.

Оператор JOIN применяется, если в запросе из чарта участвуют поля из двух и более таблиц датасета.

Оператор JOIN не применяется, если:

  • датасет содержит одну таблицу;
  • датасет содержит несколько таблиц, но в запросе участвуют поля только от одной из этих таблиц (при включенной оптимизации связи).

Для управления поведением связи при объединении данных из нескольких таблиц используйте опцию Оптимизировать связь в настройках связи. По умолчанию опция включена для всех связей в датасете — оператор JOIN применяется, когда в запросе участвуют поля из двух и более связанных таблиц. Вы можете отключить опцию для каждой конкретной связи, чтобы сделать связь обязательной. В этом случае операция объединения (оператор JOIN) будет выполняться, даже если выбираются поля только из одной таблицы.

Примечание

Отключение оптимизации может увеличить время выполнения запроса.

Подробнее про оптимизацию при использовании оператора JOIN в разделе Оптимизация данных при объединении таблиц.

Поля данныхПоля данных

Поля определяют структуру и формат датасета. Существуют следующие типы полей:

  • Измерение. Содержит значения, которые определяют характеристику данных. Например, город, дата покупки, категория продукта. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. В интерфейсе измерения отображаются зеленым цветом.
  • Показатель. Содержит числовые значения, к которым применяются функции агрегации (сведения). Например, сумма кликов, количество переходов. Если снять с такого поля функцию агрегации, оно станет измерением. В интерфейсе показатели отображаются синим цветом.

В интерфейсе создания датасета и в визарде вы можете дублировать существующие поля и создавать новые, а также использовать функции агрегации.

Важно

Максимальное количество полей в одном датасете — 1200.

DataLens позволяет создавать вычисляемые поля с помощью формул. Для записи формул вы можете использовать существующие поля датасета, константы и функции. Полный список функций приведен в разделе Справочник функций.

Подробнее о вычисляемых полях читайте в разделе Вычисляемые поля.

Агрегация данныхАгрегация данных

Для полей с различными типами данных доступны следующие функции агрегации:

Функция Описание Поддерживаемые типы
Нет Без агрегации Все типы
Среднее Среднее арифметическое значений Дробное число
Целое число
Количество Количество записей Строка
Дата
Дата и время
Дробное число
Целое число
Количество уникальных Количество уникальных записей Строка
Дата
Дата и время
Дробное число
Целое число
Максимум Максимальное значение Дата
Дата и время
Дробное число
Целое число
Минимум Минимальное значение Дата
Дата и время
Дробное число
Целое число
Сумма Сумма значений Дробное число
Целое число

Дополнительные функции агрегации доступны в вычисляемых полях.

Примечание

Для некоторых источников недоступны функции агрегации.
Источники, для которых доступна функция, перечислены в разделе Поддержка источников данных на странице функции агрегации в справочнике.

Подробнее о типах данных в разделе Типы данных Yandex DataLens.

См. такжеСм. также

  • Работа с датасетом

Была ли статья полезна?

Предыдущая
Работа с датасетом
Следующая
Настройки датасета
Проект Яндекса
© 2025 ООО «Яндекс.Облако»