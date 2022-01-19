Связаться с намиПодключиться

Дайджест новостей платформы данных (октябрь — декабрь)

Рассказываем, что нового появилось в сервисах платформы данных с октября по декабрь 2021 года.

19 января 2022 г.
Общие новости

  • Появились новые CPU-Optimized классы хостов с уменьшенным соотношением количества RAM к vCPU (2:1). Такие конфигурации могут быть полезны для кластеров с повышенными требованиями к производительности процессора.

  • Изменение политики обслуживания управляемых сервисов: теперь обслуживание будет проводиться и для выключенных кластеров. Это нужно для установки важных обновлений, в том числе связанных с безопасностью (CVE), и не повлияет на потребление ресурсов.

  • Экспресс-курс «Построение корпоративной аналитической платформы». Архитекторы Yandex.Cloud подготовили бесплатный курс, который позволит вам разобраться, как организовать сбор и анализ данных в компании для организации внешнего хранилища данных.

Managed Service for Greenplum®

  • Работа с внешними источниками данных через PXF. Доступно подключение таблиц следующих внешних источников: Apache Hive, ClickHouse, HBase, HDFS, MySQL, Oracle, PostgreSQL, SQL Server, бакеты Object Storage. Подробнее →

  • Создание кластера на группе выделенных хостов. Подробнее →

  • В UI консоли стали доступны логи событий на кластере: ошибки, предупреждения, информация.

  • Реализовали возможность изменения класса хоста существующего кластера.

  • Создана роль mdb_admin, в которой можно управлять данными других пользователей и создавать расширения. Для неё резервируются дополнительные соединения как для суперпользователя.

  • Внесены изменения, необходимые для корректной работы Point-in-time-recovery:

  • https://github.com/greenplum-db/gpdb/pull/12424

  • https://github.com/greenplum-db/gpdb/pull/12785

  • Обнаружены ошибки, приводившие к падению кластера, и отправлены pull request на их исправление.

Важно

Сервис Managed Service for Greenplum® находится на стадии Preview.

Managed Service for SQL Server

Новые возможности сервиса:

  • Поддержка версий SQL Server 2017, SQL Server 2019.

  • Процедуры для обслуживания баз данных.

  • Процедуры для управления пользовательскими сессиями.

Managed Service for Elasticsearch

  • В Yandex Managed service for Elasticsearch появилась возможность добавления hunspell словарей в анализаторы текста через API. Подробнее →

Компания Elastic ограничила доступ к сервису Elasticsearch для пользователей Yandex Cloud с апреля 2024 года. В связи с этим Yandex Managed service for Elasticsearch стал недоступен на платформе. Мы рекомендуем использовать Yandex Managed service for OpenSearch, который сопоставим по функциональности с Elasticsearch. Чтобы легко перенести данные в сервис Yandex Managed Service for OpenSearch, воспользуйтесь нашей инструкцией.

Managed Service for Redis

  • Реализовали переключение мастера для шардированного и нешардированного кластера. Подробнее →

  • Стало доступно обновление кластера с версии 6.0 на 6.2.

Managed Service for MongoDB

  • Поддержка новой версии MongoDB 5.0. Подробнее →

  • Возможность обновления с версии 4.4 на 5.0.

Managed Service for PostgreSQL

Yandex Data Proc

Рассказали об использовании sqoop и подготовили четыре нововведения:

  • Создание master-ноды с публичным IP адресом. Это позволяет подключаться к кластеру не только из той же сети. Безопасность обеспечивается с помощью групп безопасности. Подробнее →

  • Отправка логов yarn-контейнеров в cloud logging. Подробнее →

  • Использование внешних зависимостей для spark и pyspark заданий с помощью новых опций —packages, —repositories и —exclude-packages. Подробнее →

  • Новые настройки в airflow provider. Подробнее →

Managed Service for MySQL®

  • Приоритеты хостов для бекапов. Теперь среди реплик будет выбран хост с наибольшим приоритетом, а если не получится, то будет выбран мастер.

  • Изменение настроек публичного доступа. Подробнее →

Managed Service for Apache Kafka®

  • Поддержка компонентов Kafka Connect для непрерывной миграции данных в кластер или из него. Подробнее →

  • Terraform: теперь можно топики описывать через отдельный ресурс yandex_mdb_kafka_topic.

  • Добавили поддержку обновления версий кластеров.

Managed Service for ClickHouse

  • ClickHouse Keeper — новый сервис для репликации данных и выполнения распределенных DDL-запросов, реализующий совместимый с ZooKeeper клиент-серверный протокол. В отличие от ZooKeeper, ClickHouse Keeper не требует для своей работы отдельных хостов, а выполняется на хостах ClickHouse, поэтому такая отказоустойчивая конфигурация обойдется дешевле. Включить поддержку ClickHouse Keeper можно только при создании кластера. Функциональность находится в режиме Preview. Подробнее →

  • Для кластеров с гибридным хранилищем появились дополнительные storage policies: «local» и «object_storage». Политика «local» позволяет хранить данные только на локальном/сетевом диске, а политика «object_storage» — только в объектном хранилище. Возможность хранения данных в гибридном хранилище доступна всем пользователям.

DataLens

  • Навигатор для линейных и областных диаграмм с настройками. Навигатор — элемент управления отображения периода даты на графике. Теперь вы можете настраивать его состояние по умолчанию и указывать линию для отображения в навигаторе.
Навигатор для линейных и областных диаграмм
  • Формы линий. В линейных диаграммах появилась новая секция для управления типами линий. Можно использовать аналогично цвету — добавлять туда измерения или явно задавать тип линии для конкретных показателей.
Формы линий
author
Команда Yandex Cloud


