Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Compute Cloud
    • Все инструкции
      • Создать кластер GPU
      • Добавить ВМ в кластер GPU
      • Изменить кластер GPU
      • Получить информацию о кластере GPU
      • Настроить права доступа к кластеру GPU
      • Удалить кластер GPU
      • Проверить физическое состояние кластера GPU
      • Запустить параллельные задачи в кластере GPU
      • Проверить пропускную способность InfiniBand
    • Посмотреть операции с ресурсами сервиса
  • Yandex Container Solution
  • Управление доступом
  • Справочник Terraform
  • Метрики Monitoring
  • Аудитные логи Audit Trails
  • История изменений
  • Обучающие курсы
  1. Пошаговые инструкции
  2. Кластеры GPU
  3. Проверить пропускную способность InfiniBand

Проверить пропускную способность InfiniBand

Статья создана
Yandex Cloud
Обновлена 22 апреля 2025 г.
  1. Подключитесь к ВМ по SSH.

  2. Установите инструменты для тестирования:

    sudo apt update
    sudo apt install perftest numactl
    
  3. Создайте файл /etc/security/limits.d/limits.conf со следующим содержимым:

    * soft memlock unlimited
    * hard memlock unlimited
    
  4. Выйдите из системы и войдите заново или перезагрузите машину, чтобы изменения вступили в силу. Проверьте лимит командой:

    ulimit -l
    

    Результат должен быть unlimited.

  5. Создайте файл infiniband_test.sh со следующим содержимым:

    #!/bin/bash
    set -eu
    
    # Проверка лимита memlock
    echo "Текущий лимит memlock:"
    ulimit -l
    if [[ $(ulimit -l) != "unlimited" ]]; then
       echo "Лимит memlock не установлен в unlimited."
       echo "Создайте файл /etc/security/limits.d/limits.conf со следующим содержимым:"
       echo "* soft memlock unlimited"
       echo "* hard memlock unlimited"
       exit 1
    fi
    
    # Функция очистки: остановка всех процессов ib_write_bw при завершении скрипта
    clean() {
       killall -9 ib_write_bw &>/dev/null
    }
    trap clean EXIT
    
    # Параметры теста
    size=33554432  # размер блока (в байтах)
    iters=10000    # количество итераций
    q=1
    
    # Задайте номера CPU и названия сетевых устройств для разных NUMA-нод
    # Пример:
    numa0_cpu=40      # CPU для клиента (NUMA нода 0)
    numa1_cpu=130     # CPU для сервера (NUMA нода 1)
    numa0_net=mlx5_0  # сетевой интерфейс для клиента
    numa1_net=mlx5_7  # сетевой интерфейс для сервера
    
    # Запуск сервера на NUMA-ноде 1
    numactl -C $numa1_cpu --membind 1 /usr/bin/ib_write_bw --ib-dev=$numa1_net --report_gbits -s $size  --iters $iters -q $q &>/dev/null &
    sleep 1
    
    # Запуск клиента на NUMA-ноде 0 с высоким приоритетом
    nice -20 numactl -C $numa0_cpu  --membind 0 /usr/bin/ib_write_bw --ib-dev=$numa0_net --report_gbits -s $size --iters $iters -q $q localhost &
    wait
    
  6. Сделайте скрипт исполняемым:

    chmod +x infiniband_test.sh
    
  7. Запустите скрипт:

    ./infiniband_test.sh
    

    Результат:

    ---------------------------------------------------------------------------------------
    #bytes     #iterations    BW peak[Gb/sec]    BW average[Gb/sec]   MsgRate[Mpps]
    33554432    10000            394.58             394.40                    0.001469
    ---------------------------------------------------------------------------------------
    

Была ли статья полезна?

Предыдущая
Запустить параллельные задачи в кластере GPU
Следующая
Посмотреть операции с ресурсами сервиса
Проект Яндекса
© 2025 ООО «Яндекс.Облако»