Системные требования

Статья создана

Yandex Cloud

Улучшена

mmerihsesh

Обновлена 15 июня 2026 г.

Открыть в Markdown

Аппаратные требования к серверам маршрутизации и лицензирования
Аппаратные требования к серверам STT и TTS
- Примеры расчета оборудования для серверов STT и TTS
Программные требования

Для установки SpeechKit Hybrid вам необходим сервер с ОС Linux, который поддерживает Docker Engine. Список поддерживаемых ОС приведен в официальной документации Docker.

Важно

Процессор должен поддерживать набор инструкций AVX2 (Advanced Vector Support).

В Linux вы можете проверить, поддерживает ли ваш хост AVX2, командой:

grep -q avx2 /proc/cpuinfo && echo AVX2 || echo No AVX2

Аппаратные требования к серверам маршрутизации и лицензирования

Рекомендуемые аппаратные требования к серверам маршрутизации (Envoy) и лицензирования (License). Количество CPU и объем RAM таких серверов зависят от количества и типа GPU, используемых в серверах STT и TTS.

Тип GPU	RAM на 1 карту, ГБ	Физические ядра CPU на 1 карту, шт	Логические ядра (vCPU) на 1 карту, шт
NVIDIA® Tesla® L4	8	8	16
NVIDIA® Ampere® A100	10	10	20
NVIDIA® Tesla® H100	20	20	40

Аппаратные требования к серверам STT и TTS

Рекомендуемые аппаратные требования для запуска контейнеров SpeechKit Hybrid. Расчетные значения характеристик SpeechKit Hybrid приведены для справки на основе оборудования, использующего драйвер NVIDIA 535. Точные значения могут измениться после обновления контейнеров и появления новых функций.

Данные в таблицах представлены только для русского языка, если не указано иначе:

Контейнеры с GPU L4

Контейнеры с GPU A100

Контейнеры с GPU H100 PCI

Режим работы	Гарантированный SPS¹	RAM на 1 карту, ГБ	HDD на 1 карту, ГБ	Физические ядра процессора Intel Gold 6230R на 1 карту, шт	Логические ядра Intel Gold 6230R на 1 карту, шт
Распознавание речи
Потоковое распознавание	66	64	200	8	16
Распознавание аудиофайлов	330	64	200	8	16
Синтез речи
Синтез	266	64	200	8	16

Режим работы	Гарантированный SPS¹	RAM на 1 карту, ГБ	HDD на 1 карту, ГБ	Физические ядра процессора Intel Gold 6230R на 1 карту, шт	Логические ядра Intel Gold 6230R на 1 карту, шт
Распознавание речи
Потоковое распознавание	245	64	200	14	28
Распознавание аудиофайлов	1000	64	200	14	28
Синтез речи
Синтез	581	64	200	14	28

Режим работы	Гарантированный SPS¹	RAM на 1 карту, ГБ	HDD на 1 карту, ГБ	Физические ядра процессора Intel Gold 6230R на 1 карту, шт	Логические ядра Intel Gold 6230R на 1 карту, шт
Распознавание речи
Потоковое распознавание, русский язык	385	64	200	8	16
Потоковое распознавание, мультиязычная модель	245	64	200	8	16
Распознавание аудиофайлов, русский язык	3500	64	200	8	16
Распознавание аудиофайлов с определением дикторов, русский язык	2590	64	200	8	16
Синтез речи
Синтез	1260	64	200	8	16

¹ Seconds per second (SPS) — количество секунд распознанного или синтезированного текста за секунду работы.

Примеры расчета оборудования для серверов STT и TTS

Количество карт, необходимых для распознавания или синтеза текста, зависит от SPS. Для расчета воспользуйтесь формулой:

Потоковое распознавание

Распознавание аудиофайлов

Синтез

SPS пользователя = X × Y

Где:

X — доля разговора, когда включено распознавание. Если нужно перебивание, то X = 1.
Y — количество одновременных звонков.

SPS пользователя = X / Y

Где:

X — длительность распознаваемого аудио, в секундах.
Y — время на распознавание аудио, в секундах.

SPS пользователя = X × (Y / 10)

Где:

X — ожидаемое число запросов в секунду.
Y — средняя длина запроса в символах.

Количество карт рассчитывается по формуле:

SPS пользователя / гарантированный SPS карты

Итоговое значение округляется вверх до целого.

Чтобы получить необходимое количество RAM, HDD и ядер, умножьте значения из таблицы на число карт.

Программные требования

На выделенном для работы SpeechKit Hybrid сервере должны быть установлены драйверы NVIDIA LTS 535 и NVIDIA Container Toolkit 1.15 или выше. Подробнее о драйверах читайте в официальной документации NVIDIA. Устанавливать CUDA Toolkit не требуется, поскольку они входят в состав образов SpeechKit Hybrid.

Для установки и настройки сервисов SpeechKit Hybrid понадобятся интерфейс командной строки Yandex Cloud и реестр в Yandex Container Registry.

Если у вас еще нет интерфейса командной строки Yandex Cloud (CLI), установите и инициализируйте его.
Создайте реестр в Yandex Container Registry.

По умолчанию используется каталог, указанный при создании профиля CLI. Чтобы изменить каталог по умолчанию, используйте команду yc config set folder-id <идентификатор_каталога>. Также для любой команды вы можете указать другой каталог с помощью параметров --folder-name или --folder-id. Если вы обращаетесь к ресурсу по имени, поиск будет выполнен в каталоге по умолчанию. Если вы обращаетесь к ресурсу по идентификатору, поиск будет выполнен глобально — во всех каталогах с учетом прав доступа.
```
yc container registry create --name speechkit-hybrid
```
Результат:
```
id: <идентификатор_реестра>
folder_id: <идентификатор_каталога>
name: speechkit-hybrid
status: ACTIVE
created_at: "<дата_и_время_создания>"
```
Создайте сервисный аккаунт с ролью editor на выбранный каталог.
Создайте API-ключ для сервисного аккаунта.
Сообщите идентификатор созданного реестра команде SpeechKit. В вашем реестре появятся все необходимые контейнеры, и вам предоставят файл docker-compose.yaml с настройками развертывания.

Системные требования

Аппаратные требования к серверам маршрутизации и лицензированияАппаратные требования к серверам маршрутизации и лицензирования

Аппаратные требования к серверам STT и TTSАппаратные требования к серверам STT и TTS

Примеры расчета оборудования для серверов STT и TTSПримеры расчета оборудования для серверов STT и TTS

Программные требованияПрограммные требования

Была ли статья полезна?

Аппаратные требования к серверам маршрутизации и лицензирования

Аппаратные требования к серверам STT и TTS

Примеры расчета оборудования для серверов STT и TTS

Программные требования