Модель данных в DataLens
Набор данных датасета представлен в виде полей.
Источник данных
В качестве источника данных используются одна или несколько таблиц.
Примечание
Существует ограничение на показ в датасете первых 1000 таблиц из источника. Если нужные таблицы не попали в список, то на данный момент их можно добавить только вручную с помощью SQL-запроса.
Если в источнике доступно несколько таблиц, их можно объединить с помощью оператора JOIN
Объединение происходит через создание связи. В связи вы указываете поля исходной таблицы и поля таблицы, с которой происходит объединение.
Связь таблиц происходит автоматически по первому совпадению имени полей и типа данных полей.
При этом вы можете:
- изменять поля в связи;
- добавлять новые связи или удалять существующие;
- изменять в связи тип оператора
JOIN
(INNER
,LEFT
,RIGHT
,FULL
); - управлять оптимизацией связи.
Оператор JOIN
применяется, если в запросе из чарта участвуют поля из двух и более таблиц датасета.
Оператор JOIN
не применяется, если:
- датасет содержит одну таблицу;
- датасет содержит несколько таблиц, но в запросе участвуют поля только от одной из этих таблиц (при включенной оптимизации связи).
Для управления поведением связи при объединении данных из нескольких таблиц используйте опцию Оптимизировать связь в настройках связи. По умолчанию опция включена для всех связей в датасете — оператор JOIN
применяется, когда в запросе участвуют поля из двух и более связанных таблиц. Вы можете отключить опцию для каждой конкретной связи, чтобы сделать связь обязательной. В этом случае операция объединения (оператор JOIN
) будет выполняться, даже если выбираются поля только из одной таблицы.
Примечание
Отключение оптимизации может увеличить время выполнения запроса.
Подробнее про оптимизацию при использовании оператора JOIN
в разделе Оптимизация данных при объединении таблиц.
Поля данных
Поля определяют структуру и формат датасета. Существуют следующие типы полей:
- Измерение. Содержит значения, которые определяют характеристику данных. Например, город, дата покупки, категория продукта. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. В интерфейсе измерения отображаются зеленым цветом.
- Показатель. Содержит числовые значения, к которым применяются функции агрегации (сведения). Например, сумма кликов, количество переходов. Если снять с такого поля функцию агрегации, оно станет измерением. В интерфейсе показатели отображаются синим цветом.
В интерфейсе создания датасета и в визарде вы можете дублировать существующие поля и создавать новые, а также использовать функции агрегации.
Важно
Максимальное количество полей в одном датасете — 1200.
DataLens позволяет создавать вычисляемые поля с помощью формул. Для записи формул вы можете использовать существующие поля датасета, константы и функции. Полный список функций приведен в разделе Справочник функций.
Подробнее о вычисляемых полях читайте в разделе Вычисляемые поля.
Агрегация данных
Для полей с различными типами данных доступны следующие функции агрегации:
Функция | Описание | Поддерживаемые типы |
---|---|---|
Нет | Без агрегации | Все типы |
Среднее | Среднее арифметическое значений | Дробное число Целое число |
Количество | Количество записей | Строка Дата Дата и время Дробное число Целое число |
Количество уникальных | Количество уникальных записей | Строка Дата Дата и время Дробное число Целое число |
Максимум | Максимальное значение | Дата Дата и время Дробное число Целое число |
Минимум | Минимальное значение | Дата Дата и время Дробное число Целое число |
Сумма | Сумма значений | Дробное число Целое число |
Дополнительные функции агрегации доступны в вычисляемых полях.
Примечание
Для некоторых источников недоступны функции агрегации.
Источники, для которых доступна функция, перечислены в разделе Поддержка источников данных на странице функции агрегации в справочнике.
Подробнее о типах данных в разделе Типы данных Yandex DataLens.