Синтез речи с помощью Playground
Статья создана
Обновлена 6 марта 2025 г.
Чтобы преобразовать текст в речь через интерфейс SpeechKit Playground:
-
В консоли управления
выберите каталог, в котором вы будете работать с сервисом. -
В списке сервисов выберите SpeechKit.
-
Перейдите на вкладку Синтез речи.
-
Вставьте текст длиною до 5000 символов в центральную часть окна.
-
В блоке настроек в левой части окна:
- Паузы — настройте фиксированные паузы между словами тегами
<[small]>
,<[large]>
и другими. Чтобы задать паузу определенной длины, используйте тегsil<[t]>
, гдеt
— длительность паузы в миллисекундах. - Акцент на слове — поставьте акцент на слове с помощью тега
<[accented]>
или заключите слово в звездочки** **
. - Ударение — обозначьте в омографах ударную гласную, поставив перед ней символ
+
. - Фонемы — выделяйте слова блоком
[[]]
, чтобы контролировать правильность произношения с помощью фонем.
- Паузы — настройте фиксированные паузы между словами тегами
-
В блоке Настройки синтеза в правой части окна:
- Язык — задайте язык диктора.
- Голос — выберите голос диктора.
- Амплуа — контролируйте характер и эмоциональное произношение с помощью выбора амплуа диктора.
- Скорость речи — задайте темп речи диктора в диапазоне от
0.1
до3.0
, где1.0
— средняя скорость человеческой речи. - Высота голоса — скорректируйте высоту голоса диктора. Чем выше значение, тем больше интонационный контур синтезированного аудио в Гц.
- Формат аудио — выберите необходимый формат аудио.
-
Нажмите кнопку
Синтезировать и воспроизвести, чтобы синтезировать речь. -
Чтобы скачать результат, нажмите
.
SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.