Yandex Cloud
Поиск
Связаться с экспертомПопробовать бесплатно
  • Кейсы
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
  • Marketplace
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Искусственный интеллект
    • Безопасность
    • Инструменты DevOps
    • Бессерверные вычисления
    • Управление ресурсами
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Акции и free tier
  • Кейсы
  • Документация
  • Блог
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»
Yandex Compute Cloud
  • Yandex Container Solution
  • Управление доступом
  • Правила тарификации
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
    • Общие вопросы
    • Виртуальные машины
    • Ошибка Not enough resources
    • Подключение
    • Диски, снимки, образы
    • Группы виртуальных машин
    • Графические ускорители GPU
    • Мониторинг
    • Лицензирование
    • Решение проблем
    • Все вопросы на одной странице
  • Обучающие курсы
  1. Вопросы и ответы
  2. Графические ускорители GPU

Графические ускорители GPU

Статья создана
Yandex Cloud
Обновлена 28 апреля 2026 г.
  • Как проверить физическое состояние кластера GPU?

  • Как запустить параллельные задачи в кластере GPU?

  • Как проверить пропускную способность InfiniBand?

  • Что делать, если на ВМ перестала работать GPU?

Как проверить физическое состояние кластера GPU?Как проверить физическое состояние кластера GPU?

  • Проверьте порты InfiniBand.
  • Проверьте сеть.

Подробнее читайте в разделе Проверить физическое состояние кластера GPU.

Как запустить параллельные задачи в кластере GPU?Как запустить параллельные задачи в кластере GPU?

Чтобы запустить параллельные задачи в кластере GPU:

  1. Подключитесь к каждой ВМ по SSH и установите Open MPI и NCCL.
  2. На основной ВМ соберите тесты NVIDIA и настройте SSH-ключи без пароля.
  3. На каждой ВМ добавьте публичный ключ в authorized_keys.
  4. На основной ВМ выполните команду mpirun с IP-адресами ВМ и количеством GPU.

Подробнее читайте в разделе Запустить параллельные задачи в кластере GPU.

Как проверить пропускную способность InfiniBand?Как проверить пропускную способность InfiniBand?

Чтобы проверить пропускную способность InfiniBand создайте и запустите скрипт для запуска тестов perftest с использованием numactl.

Подробнее читайте в разделе Проверить пропускную способность InfiniBand.

Что делать, если на ВМ перестал работать GPU?Что делать, если на ВМ перестал работать GPU?

В таком случае необходимо остановить и снова запустить виртуальную машину. В большинстве случаев требуются именно остановка и повторный запуск, а не перезагрузка, поскольку при перезагрузке ВМ остается на том же хосте, где возникла проблема с GPU.

Была ли статья полезна?

Предыдущая
Группы виртуальных машин
Следующая
Мониторинг
Создавайте контент и получайте гранты!Готовы написать своё руководство? Участвуйте в контент-программе и получайте гранты на работу с облачными сервисами!
Подробнее о программе
Проект Яндекса
© 2026 ООО «Яндекс.Облако»