Поддерживаемые форматы аудио
SpeechSense позволяет загружать аудио в форматах:
LPCM
Linear pulse-code modulation
Требования к аудио в формате LPCM:
- частота дискретизации — в диапазоне 8–48 кГц;
- разрядность квантования — 16 бит;
- порядок байтов — обратный (little-endian);
- аудиоданные хранятся как знаковые числа (signed integer).
WAV
WAV
К аудио в формате WAV предъявляются те же требования, что и к LPCM. SpeechSense не распознает WAV, если данные закодированы в формате, отличном от LPCM, или аудио не соответствует требованиям, предъявляемым к этому формату.
MP3
MP3
SpeechSense распознает MP3 без ограничений на качество и заголовки аудиофайлов.
OggOpus
OggOpus
SpeechSense распознает OggOpus без ограничений на качество и заголовки аудиофайлов.