Синхронное распознавание аудиофайлов
Синхронное распознавание аудиофайлов отличается высокой скоростью ответа и подходит для предзаписанных одноканальных аудиофайлов небольшого размера.
Если вы хотите распознавать речь в рамках одного соединения, используйте потоковый режим. В потоковом режиме вы сможете получать промежуточные результаты распознавания.
Требования к аудио
Передаваемое аудио должно соответствовать требованиям:
- Максимальный размер файла — 1 МБ.
- Максимальная длительность — 30 секунд.
- Максимальное количество аудиоканалов — 1.
Если ваш файл больше, длиннее или у него больше аудиоканалов, используйте асинхронное распознавание.
SpeechKit позволяет распознавать и синтезировать аудио в форматах:
- LPCM
- OggOpus
- MP3
Подробнее об особенностях каждого формата смотрите в разделе Поддерживаемые форматы аудио.