Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex DataSphere
  • Начало работы
    • Все инструкции
      • Подключение к S3 с помощью библиотеки boto3
      • Подключение к базе данных ClickHouse®
      • Подключение к базе данных PostgreSQL
      • Подключение к Яндекс Диску
      • Подключение к Google Drive
    • Как перенести работу в новую версию
  • Справочник Terraform
  • Аудитные логи Audit Trails
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений
  1. Пошаговые инструкции
  2. Подключение к источникам данных
  3. Подключение к S3 с помощью библиотеки boto3

Подключение к S3 с помощью библиотеки boto3

Статья создана
Yandex Cloud
Улучшена
lakamb
Обновлена 7 марта 2025 г.

В этой инструкции описано, как подключиться к объектному хранилищу S3 в Jupyter Notebook с помощью библиотеки boto3. Для подключения к объектному хранилищу вы также можете использовать коннектор S3.

Примечание

Старайтесь не использовать хранилище S3 в режиме FUSE для работы в бакете с одноуровневыми (нерекурсивными) каталогами с большим количеством файлов. Такой сценарий использования вызывает существенное снижение производительности хранилища.

Чтобы настроить подключение к S3 из кода ноутбука:

  1. Создайте секреты token с идентификатором и key_value с секретной частью статического ключа доступа для сервисного аккаунта.

  2. Откройте проект DataSphere:

    1. Выберите нужный проект в своем сообществе или на главной странице DataSphere во вкладке Недавние проекты.

    2. Нажмите кнопку Открыть проект в JupyterLab и дождитесь окончания загрузки.
    3. Откройте вкладку с ноутбуком.
  3. Импортируйте библиотеки:

    import boto3
    import os
    from os import path
    
  4. Введите имя своего бакета в хранилище:

    bucket_name = '<имя_бакета>'
    
  5. Установите подключение:

    session = boto3.session.Session()
    
    ENDPOINT = "https://storage.yandexcloud.net"
    
    session = boto3.Session(
        aws_access_key_id=(os.environ['token']),
        aws_secret_access_key=(os.environ['key_value']),
        region_name="ru-central1",
    )
    
    s3 = session.client(
        "s3", endpoint_url=ENDPOINT)
    
  6. Введите имя бакета и получите список объектов в нем:

    for key in s3.list_objects(Bucket='<имя_бакета>')['Contents']:
        print(key['Key'])
    

Была ли статья полезна?

Предыдущая
Работа с файловыми хранилищами
Следующая
Подключение к базе данных ClickHouse®
Проект Яндекса
© 2025 ООО «Яндекс.Облако»