Подключение к S3 с помощью библиотеки boto3

Статья создана

Улучшена

Обновлена 7 марта 2025 г.

В этой инструкции описано, как подключиться к объектному хранилищу S3 в Jupyter Notebook с помощью библиотеки boto3. Для подключения к объектному хранилищу вы также можете использовать коннектор S3.

Примечание

Старайтесь не использовать хранилище S3 в режиме FUSE для работы в бакете с одноуровневыми (нерекурсивными) каталогами с большим количеством файлов. Такой сценарий использования вызывает существенное снижение производительности хранилища.

Чтобы настроить подключение к S3 из кода ноутбука:

Создайте секреты token с идентификатором и key_value с секретной частью статического ключа доступа для сервисного аккаунта.
Откройте проект DataSphere:
1. Выберите нужный проект в своем сообществе или на главной странице DataSphere во вкладке Недавние проекты.
2. Нажмите кнопку Открыть проект в JupyterLab и дождитесь окончания загрузки.
3. Откройте вкладку с ноутбуком.

Импортируйте библиотеки:

import boto3
import os
from os import path

Введите имя своего бакета в хранилище:
```
bucket_name = '<имя_бакета>'
```

Установите подключение:

session = boto3.session.Session()

ENDPOINT = "https://storage.yandexcloud.net"

session = boto3.Session(
    aws_access_key_id=(os.environ['token']),
    aws_secret_access_key=(os.environ['key_value']),
    region_name="ru-central1",
)

s3 = session.client(
    "s3", endpoint_url=ENDPOINT)

Введите имя бакета и получите список объектов в нем:

for key in s3.list_objects(Bucket='<имя_бакета>')['Contents']:
    print(key['Key'])

Подключение к S3 с помощью библиотеки boto3

Была ли статья полезна?