Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex SpeechKit Hybrid
  • Системные требования
  • Архитектура сервиса
  • Аутентификация в API
  • Правила тарификации
  • Релизы SpeechKit Hybrid

В этой статье:

  • Аппаратные требования к серверам маршрутизации и лицензирования
  • Аппаратные требования к серверам STT и TTS
  • Примеры расчета оборудования для серверов STT и TTS
  • Программные требования

Системные требования

Статья создана
Yandex Cloud
Улучшена
mmerihsesh
Обновлена 20 ноября 2025 г.
  • Аппаратные требования к серверам маршрутизации и лицензирования
  • Аппаратные требования к серверам STT и TTS
    • Примеры расчета оборудования для серверов STT и TTS
  • Программные требования

Для установки SpeechKit Hybrid вам необходим сервер с ОС Linux, который поддерживает Docker Engine. Список поддерживаемых ОС см. в официальной документации Docker.

Важно

Процессор должен поддерживать набор инструкций AVX2 (Advanced Vector Support).

В Linux вы можете проверить, поддерживает ли ваш хост AVX2, командой:

grep -q avx2 /proc/cpuinfo && echo AVX2 || echo No AVX2

Аппаратные требования к серверам маршрутизации и лицензированияАппаратные требования к серверам маршрутизации и лицензирования

Рекомендуемые аппаратные требования к серверам маршрутизации (Envoy) и лицензирования (License). Количество CPU и объем RAM таких серверов зависят от количества и типа GPU, используемых в серверах STT и TTS.

Тип GPU RAM на 1 карту,
ГБ
Физические ядра CPU
на 1 карту, шт
Логические ядра (vCPU)
на 1 карту, шт
NVIDIA® Tesla® T4 2 2 4
NVIDIA® Tesla® V100 4 4 8
NVIDIA® Tesla® L4 8 8 16
NVIDIA® Ampere® A100 10 10 20
NVIDIA® Tesla® H100 20 20 40

Аппаратные требования к серверам STT и TTSАппаратные требования к серверам STT и TTS

Рекомендуемые аппаратные требования для запуска контейнеров SpeechKit Hybrid. Расчетные значения характеристик SpeechKit Hybrid приведены для справки на основе оборудования, использующего драйвер NVIDIA 535. Точные значение могут измениться после обновления контейнеров и появления новых функций.

Данные в таблицах представлены только для русского языка:

Контейнеры с GPU T4
Контейнеры с GPU V100
Контейнеры с GPU L4
Контейнеры с GPU A100
Контейнеры с GPU H100
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 50 64 200 8 16
Распознавание аудиофайлов 250 64 200 8 16
Синтез речи
Синтез 80 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 110 64 200 8 16
Распознавание аудиофайлов 500 64 200 8 16
Синтез речи
Синтез 200 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 66 64 200 8 16
Распознавание аудиофайлов 330 64 200 8 16
Синтез речи
Синтез 383 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 245 64 200 14 28
Распознавание аудиофайлов 1000 64 200 14 28
Синтез речи
Синтез 480 64 200 14 28
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 110 64 200 8 16
Распознавание аудиофайлов 500 64 200 8 16
Синтез речи
Синтез 200 64 200 8 16

1 Seconds per second (SPS) — количество секунд распознанного или синтезированного текста за секунду работы.

Примеры расчета оборудования для серверов STT и TTSПримеры расчета оборудования для серверов STT и TTS

Количество карт, необходимых для распознавания или синтеза текста, зависит от SPS. Для расчета воспользуйтесь формулой:

Потоковое распознавание
Распознавание аудиофайлов
Синтез

SPS пользователя = X × Y

Где:

  • X — доля разговора, когда включено распознавание. Если нужно перебивание, то X = 1.
  • Y — количество одновременных звонков.

SPS пользователя = X / Y

Где:

  • X — длительность распознаваемого аудио, в секундах.
  • Y — время на распознавание аудио, в секундах.

SPS пользователя = X × (Y / 10)

Где:

  • X — ожидаемое число запросов в секунду.
  • Y — средняя длина запроса в символах.

Количество карт рассчитывается по формуле:

SPS пользователя / гарантированный SPS карты

Итоговое значение округляется вверх до целого.

Чтобы получить необходимое количество RAM, HDD и ядер, умножьте значения из таблицы на число карт.

Программные требованияПрограммные требования

На выделенном для работы SpeechKit Hybrid сервере должны быть установлены драйверы NVIDIA LTS 535 и NVIDIA Container Toolkit 1.15 или выше. Подробнее о драйверах см. в официальной документации NVIDIA. Устанавливать CUDA Toolkit не требуется, поскольку они входят в состав образов SpeechKit Hybrid.

Для установки и настройки сервисов SpeechKit Hybrid понадобятся интерфейс командной строки Yandex Cloud и реестр в Yandex Container Registry.

  1. Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.

  2. Создайте реестр в Yandex Container Registry.

    По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id.

    yc container registry create --name speechkit-hybrid
    

    Результат:

    id: <идентификатор_реестра>
    folder_id: <идентификатор_каталога>
    name: speechkit-hybrid
    status: ACTIVE
    created_at: "<дата_и_время_создания>"
    
  3. Создайте сервисный аккаунт с ролью editor на выбранный каталог.

  4. Создайте API-ключ для сервисного аккаунта.

  5. Сообщите идентификатор созданного реестра команде SpeechKit. В вашем реестре появятся все необходимые контейнеры, и вам предоставят файл docker-compose.yaml с настройками развертывания.

Была ли статья полезна?

Следующая
Архитектура сервиса
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»