Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Compute Cloud
    • Все инструкции
      • Создать кластер GPU
      • Добавить ВМ в кластер GPU
      • Изменить кластер GPU
      • Получить информацию о кластере GPU
      • Настроить права доступа к кластеру GPU
      • Удалить кластер GPU
      • Проверить физическое состояние кластера GPU
      • Запустить параллельные задачи в кластере GPU
      • Проверить пропускную способность InfiniBand
    • Посмотреть операции с ресурсами сервиса
  • Yandex Container Solution
  • Управление доступом
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Обучающие курсы

В этой статье:

  • Проверьте состояния портов InfiniBand
  • Проверьте производительность сети
  1. Пошаговые инструкции
  2. Кластеры GPU
  3. Проверить физическое состояние кластера GPU

Проверить физическое состояние кластера GPU

Статья создана
Yandex Cloud
Обновлена 26 марта 2025 г.
  • Проверьте состояния портов InfiniBand
  • Проверьте производительность сети

Проверьте состояния портов InfiniBandПроверьте состояния портов InfiniBand

  1. Подключитесь к ВМ по SSH.

  2. Установите пакет infiniband-diags:

    sudo apt update
    sudo apt install infiniband-diags
    
  3. Выполните команду ibstatus.

    Результат:

    state:           4: ACTIVE
    phys state:      5: LinkUp
    
  4. Убедитесь, что для всех портов в параметре phys state указано LinkUp.

Проверьте производительность сетиПроверьте производительность сети

Для проверки скорости передачи данных между GPU на разных ВМ:

  1. На каждой из тестовых ВМ установите пакет perftest:

    sudo apt install perftest
    
  2. Подключитесь к первой ВМ по SSH.

  3. Выполните команду:

    ib_send_bw --report_gbits
    
  4. Подключитесь ко второй ВМ по SSH.

  5. Выполните команду:

    ib_send_bw <внутренний_IP_первой_ВМ> --report_gbits
    

    Результат:

    #bytes     #iterations    BW peak[Gb/sec]    BW average[Gb/sec]   MsgRate[Mpps]
    65536      1000             245.54             244.08             0.465536
    
  6. Убедитесь, что в выводе ненулевые значения параметров:

    • BW average[Gb/sec] — средняя скорость передачи;
    • MsgRate[Mpps] — частота сообщений.

Была ли статья полезна?

Предыдущая
Удалить кластер GPU
Следующая
Запустить параллельные задачи в кластере GPU
Проект Яндекса
© 2025 ООО «Яндекс.Облако»