Графические ускорители GPU
Compute Cloud предоставляет графические ускорители (GPU) в различных конфигурациях виртуальных машин. GPU обрабатывают некоторые типы данных эффективнее, чем CPU, и могут использоваться для сложных вычислений. Сделать решение задач еще эффективнее и удобнее поможет автоматическое выделение ресурсов в Yandex DataSphere.
В Compute Cloud доступны следующие графические карты:
- NVIDIA® Tesla® V100
с 32 ГБ памяти HBM2 (High Bandwidth Memory). - NVIDIA® Ampere® A100
с 80 ГБ памяти HBM2. - NVIDIA® Tesla® T4
с 16 ГБ памяти GDDR6.
Важно
GPU работает в режиме TCC
По умолчанию в облаке установлена нулевая квота на создание виртуальных машин с GPU. Вы можете запросить увеличение квоты в консоли управленияquota-manager.requestOperator
или выше.
ВМ с GPU нельзя создавать в зоне доступности ru-central1-c
. Подробнее см. в разделе Вывод из эксплуатации зоны доступности ru-central1-c.
Графические ускорители (GPU)
Графические ускорители подходят для задач машинного обучения (Machine Learning, ML), искусственного интеллекта (Artificial Intelligence, AI) и обработки трехмерной графики (3D Rendering).
Контролировать GPU и RAM можно непосредственно с ВМ.
NVIDIA® Tesla® V100
Графическая карта NVIDIA® Tesla® V100 содержит 5120 ядер CUDA®, позволяющих выполнять высокопроизводительные вычисления
NVIDIA® Ampere® A100
NVIDIA® A100, построенная на базе микроархитектуры Ampere®
NVIDIA® Tesla® T4
NVIDIA® Tesla® T4, построенная на базе архитектуры Turing™
T4i
T4i использует тензорные ядра и предоставляет 24 ГБ памяти GDDR6 с пропускной способностью 300 ГБ/с.
Конфигурации виртуальных машин
Доступные конфигурации вычислительных ресурсов:
-
Платформа Intel Broadwell with NVIDIA® Tesla® V100 (
gpu-standard-v1
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 1 32 8 96 2 64 16 192 4 128 32 384 -
Платформа Intel Cascade Lake with NVIDIA® Tesla® V100 (
gpu-standard-v2
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 1 32 8 48 2 64 16 96 4 128 32 192 8 256 64 384 -
Платформа AMD EPYC™ with NVIDIA® Ampere® A100 (
gpu-standard-v3
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 1 80 28 119 2 160 56 238 4 320 112 476 8 640 224 952 -
Платформа AMD EPYC™ 9474F with Gen2 (
gpu-standard-v3i
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 8 640 180 1440 -
Платформа Intel Ice Lake with NVIDIA® Tesla® T4 (
standard-v3-t4
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 1 16 4 16 1 16 8 32 1 16 16 64 1 16 32 128 -
Платформа Intel Ice Lake with T4i (
standard-v3-t4i
):Количество GPU Объем VRAM, ГБ Количество vCPU Объем RAM, ГБ 1 24 4 16 1 24 8 32 1 24 16 64 1 24 32 128
GPU в виртуальных машинах предоставляется целиком. Например, если в конфигурации указано 4 GPU, то у вашей ВМ будет 4 полноценных GPU-устройства.
Виртуальные машины на платформах Intel Broadwell with NVIDIA® Tesla® V100, Intel Cascade Lake with NVIDIA® Tesla® V100, AMD EPYC™ with NVIDIA® Ampere® A100 и Intel Ice Lake with NVIDIA® Tesla® T4 можно создать в зонах доступности ru-central1-a
и ru-central1-b
.
Ознакомиться с организационными и техническими ограничениями ВМ можно в разделе Квоты и лимиты.
Стоимость виртуальных машин с GPU см. в разделе Вычислительные ресурсы ВМ.
Образы операционных систем
Для виртуальных машин с GPU доступны специальные образы операционных систем с драйверами NVIDIA:
- Intel Broadwell with NVIDIA® Tesla® V100 и Intel Cascade Lake with NVIDIA® Tesla® V100
-
- Ubuntu 16.04 LTS GPU (
ubuntu-1604-lts-gpu
) - Ubuntu 20.04 LTS GPU (
ubuntu-2004-lts-gpu
)
- Ubuntu 16.04 LTS GPU (
- Intel Ice Lake with NVIDIA® Tesla® T4
-
- Ubuntu 20.04 LTS GPU (
ubuntu-2004-lts-gpu
)
- Ubuntu 20.04 LTS GPU (
- AMD EPYC™ with NVIDIA® Ampere® A100
-
- Ubuntu 20.04 LTS GPU A100 (
ubuntu-2004-lts-a100
) - Ubuntu 18.04 LTS GPU A100 (
ubuntu-1804-lts-a100
)
- Ubuntu 20.04 LTS GPU A100 (
Мы рекомендуем использовать стандартный образ от Yandex Cloud. Вы также можете установить драйверы на другой стандартный образ самостоятельно или создать собственный образ с предустановленными драйверами.
Кластеры GPU
Вы можете объединить в кластер несколько виртуальных машин. Объединение позволяет ускорить выполнение задач распределенного обучения, требующих больших вычислительных мощностей, чем предоставляют отдельные ВМ. Кластер должен создаваться в той же зоне доступности, что и ВМ, которые будут в него входить. ВМ внутри кластера объединены высокоскоростной и защищенной сетью Infiniband.
В кластер можно добавить машины из разных каталогов и из разных сетей и подсетей. Для корректного взаимодействия виртуальных машин, включенных в кластер, рекомендуется использовать группу безопасности, разрешающую неограниченный трафик внутри группы. Группа безопасности по умолчанию удовлетворяет этому требованию. Если группа безопасности по умолчанию была отредактирована, добавьте группу, обеспечивающую неограниченный обмен трафиком внутри себя, вручную.
Максимальный возможный размер кластера на платформе AMD EPYC™ 9474F with Gen2 — 20 ВМ с конфигурацией 8 GPU, 80 ГБ VRAM, 180 vCPU, 1440 ГБ RAM. Фактический максимальный размер кластера ограничен технической доступностью ресурсов.
Смотрите также
- Создание виртуальной машины с GPU.
- Узнайте, как добавить GPU к существующей ВМ.
- Узнайте, как изменить количество GPU.