Новый сервис для анализа и визуализации данных Yandex DataLens на платформе Яндекс.Облако
Первый обзор нового инструмента для бизнес-аналитики.
4 апреля платформа Яндекс.Облако представила свой сервис бизнес-аналитики и визуализации данных Yandex DataLens, который позволяет работать с данными из разных источников и визуализировать их для последующего анализа и принятия решений.
Разберемся, почему инструмент, выросший из собственной бизнес-аналитики компании Яндекс, будет интересен всем, кто работает с данными, даже в текущей стадии Preview.
Запуск Yandex DataLens отвечает мировым трендам
Эксперты предсказывают, что в 2018–2022 годах аналитическое ПО ждут три значительных изменения:
- повышение важности использования данных в современных компаниях,
- продолжающийся переход в публичное облако,
- использование технологий ИИ и машинного обучения в корпоративных приложениях.
Основанием для принятия бизнес–решений сегодня служат разнообразные данные, собранные при создании и реализации товаров и услуг. Качественная визуализация данных и аналитические дашборды позволяют «читать» информацию с одного взгляда, видеть аномалии и наглядно сравнивать различные наборы данных (иначе датасеты).
Системы бизнес-аналитики нужны всем компаниям, но на пути их внедрения существуют барьеры, преодолеть которые под силу чаще крупным организациям. Yandex DataLens обладает достоинствами корпоративных решений, но при этом будет доступен даже самым небольшим компаниям, благодаря своей простоте и низкому порогу входа.
Доступный с сегодняшнего дня в стадии Preview сервис Yandex DataLens может опробовать любой пользователь Яндекс.Облака. При этом интерфейс Yandex DataLens предельно прост: чтобы проверить гипотезу или визуализировать данные нужно подключиться к источнику, определить набор данных и построить диаграмму или таблицу. А из множества графиков и таблиц можно составить дашборд и поделиться им с коллегами.
Корпоративный стандарт Яндекса становится доступен клиентам и партнёрам
Yandex DataLens на платформе Яндекс.Облако является частью внутренней корпоративной системы обработки, хранения, визуализации и анализа данных Yandex Stat. Фактически наш корпоративный стандарт работы с данными стал доступен любому бизнесу.
Чтобы понять, с чем приходилось иметь дело системе Yandex Stat в компании Яндекс, оцените несколько цифр, характеризующих его работу:
- Около 5 тысяч пользователей.
- Более 3 тысяч дашбордов с более, чем 30 000 диаграмм и таблиц.
- Более 40 миллионов запросов в месяц.
- Более 1,5 миллиардов новых строк данных ежедневно.
А вот несколько кейсов использования функциональности Yandex DataLens в наших сервисах:
- Яндекс.Драйв: аналитика простоя машин, пешей доступности машин для пользователей, результатов экспериментов.
- Едадил: аналитика маркетинговых кампаний, AdHoc-аналитика для партнерских менеджеров.
- Яндекс.Погода: мониторинг качества и приемки новых ML- моделей для прогноза.
- Яндекс.Учебник: аналитика каналов привлечения траффика, аналитика региональной активности.
- Беспилотные автомобили: аналитика дорожных ситуаций и событий распознавания среды.
Как устроена визуализация данных в Yandex DataLens
Концептуально объектная модель Yandex DataLens базируется на четырёх компонентах:
- Подключение (параметры подключения к источнику данных).
- Датасет (набор данных из источника для дальнейшей визуализации).
- Чарт (визуализация данных).
- Дашборд (страница с набором визуализаций и фильтрами).
Для каждого компонента предусмотрено управление доступом.
Подключение к различным источникам реализуется с помощью встроенных коннекторов: данные в формате CSV, информация из PostgreSQL, MS SQL Server, MySQL, ClickHouse, API Яндекс.Метрики, MetricaLogsAPI. Перечень источников расширяется.
Данные из источника можно дополнить вычисляемыми полями используя различные (логические, математические, текстовые…) функции. В зависимости от источника данных доступны следующие функции:
-
Агрегатные функции.
-
Функции даты и времени.
-
Логические функции.
-
Математические функции.
-
Операторы.
-
Строковые функции.
-
Функции преобразования типов.
Описание всех доступных на данный момент функций и их синтаксис можно посмотреть в Справочнике функций.
После того, как вы выполнили подключение, визуализировали данные и построили дашборд, пришла пора поделиться визуализацией, например, показать результаты проделанной работы клиенту или вместе с коллегами сопоставить данные о продажах из внутренней CRM-системы с отчётами о рекламных кампаниях из Яндекс.Метрики.
В повседневной практике полезна автоматическая загрузка часто используемых данных: система будет сама загружать информацию и обновлять графики с заданной периодичностью. Таким образом уменьшается нагрузка на источник данных и ускоряется работа с графиками и таблицами.
Конечная цель работы с данными — исследование зависимостей и получение инсайтов. Мы предлагаем тестовые наборы данных, которые помогут научиться работе с Yandex DataLens:
- Визуализация данных из CSV-файла
- Визуализация данных из базы данных ClickHouse
- Визуализация данных из Metriсa
Понятный интерфейс Yandex DataLens не вызовет вопросов у тех, кто уже имел дело с аналитическими сервисами. Новичкам будет полезно сначала изучить документацию.
Как получить доступ?
В настоящее время сервис Yandex DataLens на платформе Яндекс.Облако работает в тестовом режиме. Его использование бесплатно для всех, у кого есть аккаунт на платформе Яндекс.Облако. Чтобы начать пользоваться мощной бизнес-аналитикой здесь и сейчас, достаточно выполнить четыре шага:
- Зарегистрироваться и создать платежный аккаунт в Яндекс.Облаке
- Оставить заявку на доступ к Preview
- Получить подтверждение
- Активировать DataLens.