Установка NVIDIA-драйверов
Для совместимости с GPU на виртуальной машине должны быть установлены драйверы NVIDIA. Драйверы можно установить как при подготовке образа, так и изнутри ВМ после ее создания.
Драйверы для Tesla® V100
Чтобы установить драйверы для графической карты NVIDIA® Tesla® V100:
- Перейдите на страницу формы
. - Выберите Data Center / Tesla в поле Тип продукта.
- Выберите V-Series в поле Серия продуктов.
- Выберите Tesla V100 в поле Семейство продуктов.
- Выберите ОС в поле Операционная система.
- Укажите остальные настройки в соответствии с вашей операционной системой и требованиям к драйверу.
- Нажмите кнопку Поиск. Откроется страница с подходящим драйвером.
- Нажмите кнопку Загрузить сейчас.
- Запустите загруженный установщик и следуйте инструкциям.
Драйверы для Ampere® A100
В Compute Cloud доступно две конфигурации ВМ на платформе AMD EPYC® with NVIDIA® Ampere® A100: с 1 GPU и с 8 GPU. Для конфигурации с 8 GPU необходимо дополнительно установить Fabric Manager
Чтобы установить драйверы для графической карты NVIDIA® Ampere® A100:
- Перейдите на страницу формы
. - Выберите Data Center / Tesla в поле Тип продукта.
- Выберите A-Series в поле Серия продуктов.
- Выберите NVIDIA A100 в поле Семейство продуктов.
- Выберите ОС в поле Операционная система.
- Укажите остальные настройки в соответствии с вашей операционной системой и требованиям к драйверу.
- Нажмите кнопку Поиск. Откроется страница с подходящим драйвером.
- Нажмите кнопку Загрузить сейчас.
- Запустите загруженный установщик и следуйте инструкциям.
Чтобы установить и настроить Fabric Manager:
-
В терминале выполните:
sudo apt install -y nvidia-driver-<версия_драйвера>-server nvidia-utils-<версия_драйвера>-server nvidia-fabricmanager-<версия_драйвера> sudo systemctl enable nvidia-fabricmanager sudo systemctl start nvidia-fabricmanager
Примечание
При установке укажите нужную версию драйвера (например, 460).
-
Проверьте работу Fabric Manager:
nvidia-smi nvlink -s