Системные требования
Для установки SpeechKit Hybrid вам необходим сервер с ОС Linux, который поддерживает Docker Engine. Список поддерживаемых ОС см. в официальной документации Docker
Важно
Процессор должен поддерживать набор инструкций AVX2
В Linux вы можете проверить, поддерживает ли ваш хост AVX2, командой:
grep -q avx2 /proc/cpuinfo && echo AVX2 || echo No AVX2
Аппаратные требования
Рекомендуемые аппаратные требования для запуска контейнеров SpeechKit Hybrid. Расчетные значения характеристик SpeechKit Hybrid приведены для справки на основе оборудования, использующего драйвер NVIDIA 535. Точные значение могут измениться после обновления контейнеров и появления новых функций.
Данные в таблицах представлены только для русского языка:
Режим работы | Гарантированный SPS1 |
RAM на 1 карту, ГБ |
HDD на 1 карту, ГБ |
Физические ядра процессора Intel Gold 6230R на 1 карту, шт |
Логические ядра Intel Gold 6230R на 1 карту, шт |
---|---|---|---|---|---|
Распознавание речи | |||||
Потоковое распознавание | 50 | 64 | 200 | 8 | 16 |
Распознавание аудиофайлов | 250 | 64 | 200 | 8 | 16 |
Синтез речи | |||||
Синтез | 80 | 64 | 200 | 8 | 16 |
Режим работы | Гарантированный SPS1 |
RAM на 1 карту, ГБ |
HDD на 1 карту, ГБ |
Физические ядра процессора Intel Gold 6230R на 1 карту, шт |
Логические ядра Intel Gold 6230R на 1 карту, шт |
---|---|---|---|---|---|
Распознавание речи | |||||
Потоковое распознавание | 110 | 64 | 200 | 8 | 16 |
Распознавание аудиофайлов | 500 | 64 | 200 | 8 | 16 |
Синтез речи | |||||
Синтез | 200 | 64 | 200 | 8 | 16 |
Режим работы | Гарантированный SPS1 |
RAM на 1 карту, ГБ |
HDD на 1 карту, ГБ |
Физические ядра процессора Intel Gold 6230R на 1 карту, шт |
Логические ядра Intel Gold 6230R на 1 карту, шт |
---|---|---|---|---|---|
Распознавание речи | |||||
Потоковое распознавание | 245 | 64 | 200 | 14 | 28 |
Распознавание аудиофайлов | 1000 | 64 | 200 | 14 | 28 |
Синтез речи | |||||
Синтез | 480 | 64 | 200 | 14 | 28 |
1 Seconds per second (SPS) — количество секунд распознанного или синтезированного текста за секунду работы.
Примеры расчета оборудования
Количество карт, необходимых для распознавания или синтеза текста, зависит от SPS. Для расчета воспользуйтесь формулой:
SPS пользователя = X × Y
Где:
- X — доля разговора, когда включено распознавание. Если нужно перебивание, то X = 1.
- Y — количество одновременных звонков.
SPS пользователя = X / Y
Где:
- X — длительность распознаваемого аудио, в секундах.
- Y — время на распознавание аудио, в секундах.
SPS пользователя = X × (Y / 10)
Где:
- X — ожидаемое число запросов в секунду.
- Y — средняя длина запроса в символах.
Количество карт рассчитывается по формуле:
SPS пользователя / гарантированный SPS карты
Итоговое значение округляется вверх до целого.
Чтобы получить необходимое количество RAM, HDD и ядер, умножьте значения из таблицы на число карт.
Программные требования
Выделенный для работы SpeechKit Hybrid сервер должен поддерживать запуск контейнеров на базе CUDA® 11.4 и выше
Для установки и настройки сервисов SpeechKit Hybrid понадобятся интерфейс командной строки Yandex Cloud и реестр в Yandex Container Registry.
-
Если у вас еще нет интерфейса командной строки Yandex Cloud, установите и инициализируйте его.
-
Создайте реестр в Yandex Container Registry.
По умолчанию используется каталог, указанный в профиле CLI. Вы можете указать другой каталог с помощью параметра
--folder-name
или--folder-id
.yc container registry create --name speechkit-hybrid
Результат:
id: <идентификатор_реестра> folder_id: <идентификатор_каталога> name: speechkit-hybrid status: ACTIVE created_at: "<дата_и_время_создания>"
-
Создайте сервисный аккаунт с ролью
editor
на выбранный каталог. -
Создайте API-ключ для сервисного аккаунта.
-
Сообщите идентификатор созданного реестра команде SpeechKit. В вашем реестре появятся все необходимые контейнеры, и вам предоставят файл
docker-compose.yaml
с настройками развертывания.