История изменений в Yandex DataSphere
- Релиз 09.12.2024
- Релиз 11.11.2024
- Релиз 02.09.2024
- Релиз 30.07.2024
- Релиз 04.07.2024
- Релиз 18.06.2024
- Релиз 03.04.2024
- Релиз 27.03.2024
- Релиз 01.03.2024
- Релиз 27.02.2024
- Релиз 29.01.2024
- Релиз 15.01.2024
- Релиз 20.12.2023
- Релиз 10.10.2023
- Релиз 25.09.2023
- Релиз 18.09.2023
- Релиз 21.07.2023
- Релиз 20.06.2023
- Релиз 23.05.2023
- Релиз 29.03.2023
- Релиз 24.03.2023
- Релиз 02.03.2023
- Релиз 19.01.2023
- Релиз 20.10.2022
- Релиз 23.09.2022
- Релиз 11.01.2022
- Релиз 18.11.2021
- Релиз 24.09.2021
- Релиз 16.02.2021
- Релиз 10.02.2021
- Релиз 24.12.2020
- Релиз 08.12.2020
- Релиз 23.11.2020
- Релиз 11.11.2020
- Релиз 01.10.2020
Здесь будет опубликована информация об изменениях в сервисе Yandex DataSphere.
Совет
Чтобы всегда быть в курсе последних изменений и обновлений, подпишитесь на наш Telegram-канал новостей Yandex DataSphere Community
Релиз 09.12.2024
Прекращена поддержка дообучения фундаментальных моделей в DataSphere. Уже дообученные модели перестанут поддерживаться вместе со своими базовыми моделями в соответствии с жизненным циклом.
Для дообучения моделей используйте инструменты сервиса Yandex Foundation Models.
Релиз 11.11.2024
Появилась возможность работать с сервисами Yandex Cloud из ноутбуков DataSphere, в том числе выпускать токены для авторизации, с помощью сервисного агента. Воспользуйтесь инструкцией, чтобы включить эту возможность в сообществе. Подробнее о том, как работают сервисные агенты, см. в документации Identity and Access Management.
Релиз 02.09.2024
- В стартовые ноутбуки добавлены примеры работы с моделью YandexART и фундаментальными моделями с открытым кодом.
- При работе с Yandex Data Processing с помощью коннектора Spark добавлена возможность синхронизации окружения.
- Исправлены ошибки и добавлены небольшие улучшения в работе сервиса.
Релиз 30.07.2024
- Появилась возможность создавать сообщества в разных зонах доступности —
ru-central1-a
иru-central1-b
. - К нодам теперь можно подключить дополнительный диск размером от 10 до 4096 ГБ.
- Исправлены ошибки и добавлены небольшие улучшения в работе сервиса.
Релиз 04.07.2024
- У проектов DataSphere появился новый тип ресурсов — коннекторы Spark для интеграции с Yandex Data Processing.
- Улучшено создание нод.
- Улучшен процесс привязки платежного аккаунта к сообществу.
- Исправлены ошибки и добавлены небольшие улучшения в работе сервиса.
Релиз 18.06.2024
- Появилась возможность разворачивать инстансы нод в разных зонах доступности —
ru-central1-a
иru-central1-b
. - Появилась возможность повторного запуска заданий.
- Прекращена поддержка Python 3.7.
- Исправлены ошибки и добавлены небольшие улучшения в работе сервиса.
Релиз 03.04.2024
- Изменились конфигурации временных кластеров Yandex Data Processing.
- Ноды из моделей теперь можно развернуть из моделей XGBoost и LightGBM.
- В API исполнения добавлена возможность передавать входные переменные.
- Улучшено создание нод из Docker-образов.
- Исправлены ошибки и добавлены небольшие улучшения в работе сервиса.
Релиз 27.03.2024
Дообучение модели в DataSphere теперь работает на базе новой модели YandexGPT Pro.
Релиз 01.03.2024
Режим Serverless больше не поддерживается.
Релиз 27.02.2024
- В API добавлена возможность исполнения ноутбука в Dedicated режиме.
- Улучшены логи и метрики для нод.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 29.01.2024
- Обновлен драйвер NVIDIA до версии 535.
- Добавлена поддержка мультилогина в несколько организаций в разных федерациях.
- Добавлена возможность приостанавливать и возобновлять работу нод.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 15.01.2024
- На страницу проекта добавлены инструменты для самостоятельного решения проблем.
- В DataSphere Jobs добавлена возможность использовать ресурсы проекта — секреты, коннекторы S3, докеры окружения, датасеты и проектный диск.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 20.12.2023
- Добавлена новая конфигурация gt4.1 (1 GPU NVIDIA T4).
- Конфигурация g2.mig (1 GPU MIG NVIDIA Ampere A100) выведена из эксплуатации.
- Доступен новый тип нод из ресурса модель.
- При выборе конфигурации в режиме Dedicated будет отображаться ее доступность в данный момент.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 10.10.2023
- Дообученные модели YandexGPT можно опробовать прямо в DataSphere. YandexGPT Playground в DataSphere доступен после дообучения тем, у кого есть доступ к YandexGPT API.
- Появилась возможность подключения к JupyterLab проекта DataSphere из локальной IDE.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 25.09.2023
- С помощью DataSphere Jobs стало возможным использовать облачные вычислительные ресурсы в рамках DataSphere из локальной среды пользователя.
- У проектов DataSphere появился новый тип ресурсов — Модели.
- В JupyterLab 3 (доступен в режиме Dedicated) добавлены расширения, повышающие удобство работы.
- На стадии Preview доступно дообучение модели YandexGPT.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 18.09.2023
- Новый системный образ DS Default (Python 3.10) используется по умолчанию.
- Для администраторов сообществ добавлена возможность управлять разрешениями на использование функционала.
- Улучшена работа со списком сообществ и проектов.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 21.07.2023
- Обновлено расширение JupyterLab для работы с GIT.
- Для администраторов сообществ добавлена возможность управлять разрешениями на использование вычислительных ресурсов.
- Появилась возможность добавления участников сообществ и проектов до того, как они примут приглашение в организацию.
- Улучшен редактор сборки Docker-образа.
- В стартовые ноутбуки добавлен пример работы с YandexGPT API.
- Процесс запуска проекта стал нагляднее и прозрачнее.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 20.06.2023
- Добавлена страница со списком всех проектов
пользователя. - Обновлены стартовые ноутбуки.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 23.05.2023
- В DataSphere появился новый режим работы Dedicated.
- В режиме Dedicated обновлена версия IDE до JupyterLab 3.5.3.
- Улучшен выбор организации.
- Работа с участниками сообществ и проектов стала проще.
- Исправлены ошибки и добавлены небольшие улучшения в работе платформы.
Релиз 29.03.2023
- Добавлена возможность работы с метками для маркировки ресурсов.
- Исправлены ошибки и добавлены небольшие улучшения.
Релиз 24.03.2023
- Добавлен инструмент миграции проектов в новую версию DataSphere.
- Исправлены ошибки и добавлены небольшие улучшения.
Релиз 02.03.2023
- Добавлена работа с новой версией DataSphere через API.
- Исправлены ошибки и добавлены небольшие улучшения.
Релиз 19.01.2023
- Добавлено отображение наследуемых ролей участников сообществ и проектов.
- Улучшены расширенные настройки проектов.
- Обновлены сниппеты для работы с S3, Яндекс Диском и Google Drive.
- Исправлены ошибки и добавлены небольшие улучшения.
Релиз 20.10.2022
Значительно улучшили работу с кластерами Apache Spark™:
- В DataSphere появился новый тип ресурсов — шаблоны Yandex Data Processing.
- Появилась возможность конфигурировать livy-сессию при работе с кластерами Yandex Data Processing.
- Теперь DataSphere поддерживает работу с библиотекой Spark SQL.
Релиз 23.09.2022
Встречайте большое обновление DataSphere: новый интерфейс, сообщества, ресурсы и множество других возможностей для ML-разработки.
Релиз 11.01.2022
- Добавлены новые конфигурации вычислительных ресурсов:
- g2.mig (1 MIG NVIDIA Ampere A100)
- g2.2 (2 GPU NVIDIA Ampere A100)
- g2.4 (4 GPU NVIDIA Ampere A100)
- Обновлены ознакомительные ноутбуки
Добро пожаловать
на русском и английском языках. - Исправлены ошибки, добавлены небольшие улучшения.
Релиз 18.11.2021
- Добавлена возможность самостоятельно изменять размер хранилища проекта.
- Появилась возможность задавать ограничения на потребление отдельных каталогов и проектов, чтобы управлять расходами.
- Сократилось время открытия проекта.
- Исправлены ошибки, добавлены небольшие улучшения.
Релиз 24.09.2021
- Появилась возможность подключиться к объектному хранилищу S3 из интерфейса.
- Добавлено быстрое развертывание эксплуатации моделей из ячеек с кодом на Python.
Релиз 16.02.2021
Добавлен новый режим сохранения состояния Autosave Commit Mode.
Релиз 10.02.2021
- Изменился подход к сериализации состояния. Старый режим изменился и стал чуть удобнее, плюс появилась возможность включить режим autosave.
- Добавлена индикация загрузки GPU.
- Добавлена возможность обратиться в поддержку из сервиса.
Релиз 24.12.2020
-
Представлен новый режим работы в DataSphere — Early Access Version.
Early Access Version — это pre-release версия системы, где будут анонсироваться все важные новые функциональные возможности.
Примечание
Как воспользоваться?
Режим работы Early Access Version выбирается целиком для проекта. Для активации этого режима выберите в меню проекта File пункт Enable Early Access Version.
Вы всегда можете вернуться к обычному режиму работы, перейдя в проекте в пункт меню File и выбрав пункт Disable Early Access Version.Где посмотреть:
Все детали того, что нового появилось в релизе и как воспользоваться, описаны в нашем новом ноутбуке: Что нового в Early Access?.
-
Добавлена индикация загрузки памяти и CPU в DataSphere — объемы использования ядер процессора и памяти показываются прямо в интерфейсе ноутбука.
-
Добавлена поддержка TensorBoard.
-
Реализована возможность фонового асинхронного выполнения операций в специально обозначенных ячейках.
Релиз 08.12.2020
Появился ознакомительный ноутбук Добро пожаловать (на русском языке). Он рассказывает, как устроен сервис и как быстро начать им пользоваться.
Релиз 23.11.2020
- Исправлена работа code completion.
- Добавлена поддержка
widgets
.
Релиз 11.11.2020
- Реализована поддержка TensorFlow версии 2.x.
- Реализована поддержка обновления предустановленных библиотек, в том числе TensorFlow.
- Доработан алгоритм определения измененных переменных, теперь в коммит попадают только действительно измененные переменные, что сокращает время на сохранение состояния.
- Добавлен сниппет для работы с кластером SPARK.
Релиз 01.10.2020
-
Yandex DataSphere перешел в коммерческий доступ, он же GA, и стал платным.
Тарификация посекундная, оплата только за время вычислений, работа в самих ноутбуках не тарифицируется.
Единица тарификации — это один тарифицирующий юнит. Стоимость одного тарифицирующего юнита — это стоимость использования 1 ядра CPU в течение 1 секунды.Количество юнитов и стоимость зависит от конфигурации вычислительных ресурсов.
-
Добавлена возможность использования команды bash.
Команда
%%bash
по-прежнему напрямую недоступна, но ее функциональностью можно воспользоваться следующим образом:- в заголовках ячейки необходимо указать
#!S:bash
(S
— указание на тип ВМ, на которой нужно запустить bash).
Ограничения:
- не поддерживается запуск фоновых задач, например,
sshd
. - не поддерживается запуск
pip
, эта команда доступна по-прежнему только черезmagic
.
- в заголовках ячейки необходимо указать
-
Появилась полноценная интеграция с Apache Spark™. Можно запускать вычисления на уже существующих кластерах Yandex Data Processing, и даже создавать временные кластера Yandex Data Processing непосредственно из сервиса DataSphere.
-
Добавлено версионирование и работа с контрольными точками.
-
Добавлены новые типы конфигураций:
M
(8 cores, 0 gpu) иXL
(32 cores, 4 gpu Nvidia v100).