Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex DataSphere
  • Начало работы
    • О сервисе DataSphere
    • Взаимосвязь ресурсов в DataSphere
    • Сообщества
    • Управление расходами
    • Проект
    • Конфигурации вычислительных ресурсов
      • Обзор
      • Секреты
      • Docker-образы
      • Датасеты
      • Шаблоны Yandex Data Processing
      • Коннекторы S3
      • Коннекторы Spark
      • Модели
      • Файловые хранилища
    • Фундаментальные модели
    • Квоты и лимиты
    • Специальные условия для образования
  • Справочник Terraform
  • Аудитные логи Audit Trails
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений
  1. Концепции
  2. Ресурсы
  3. Датасеты

Датасеты в DataSphere

Статья создана
Yandex Cloud
Улучшена
Dmitry A.
Обновлена 27 декабря 2023 г.

Датасет в DataSphere — это механизм хранения информации, который предоставляет быстрый доступ к большим объемам данных. Датасеты позволяют хранить до 4 ТБ, при этом доступ к данным будет быстрее, чем к основному хранилищу проекта.

Совет

Чем больше выделенный для датасета диск, тем выше скорость чтения данных.

Создание и наполнение датасета происходит во время инициализации. После инициализации датасет нельзя изменить, он будет доступен только для чтения. Если вы хотите добавить файлы в датасет, создайте его заново.

Датасеты не включены в основное хранилище проекта и тарифицируются отдельно.

Как и другими ресурсами, датасетами можно делиться в сообществе, чтобы использовать данные в нескольких проектах.

При активации в проекте диск с датасетом монтируется к хранилищу проекта. Файлы активированного датасета можно читать как локальные файлы хранилища проекта по пути /home/jupyter/mnt/datasets/<имя_датасета>.

Одновременно в проекте может быть активировано до 3 датасетов. Вы можете активировать и деактивировать датасеты проекта прямо во время работы без перезагрузки проекта. Все ограничения DataSphere см. в разделе Квоты и лимиты в DataSphere.

Информация о датасете как ресурсеИнформация о датасете как ресурсе

О каждом датасете хранится следующая информация:

  • имя;
  • статус подключения к проекту;
  • имя пользователя, создавшего датасет;
  • дата создания датасета в формате в UTC, например 18 июля 2022 г., 14:23.

Чтобы посмотреть подробную информацию о датасете, нажмите на его название в списке датасетов проекта. На вкладке Обзор конкретного датасета можно увидеть:

  • зону доступности, в которой хранится датасет;
  • размер;
  • код инициализации.

См. такжеСм. также

  • Работа с датасетами

Была ли статья полезна?

Предыдущая
Docker-образы
Следующая
Шаблоны Yandex Data Processing
Проект Яндекса
© 2025 ООО «Яндекс.Облако»