Поддерживаемые языки и модели распознавания
Модель распознавания — модель, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных из сервисов и приложений Яндекса. Это позволяет постоянно улучшать качество распознавания.
Основная поддерживаемая модель для каждого типа распознавания — модель general
. Она распознает речь на любую тему на заданном языке: короткие и длинные фразы, а также имена, адреса, даты и числа.
Теги версий
Одновременно могут быть доступны три версии модели general
. Выбрать нужную версию можно по тегам:
general
— основная версия модели.general:rc
— версия-кандидат для релиза, которую вы можете тестировать.general:deprecated
— предыдущая версия модели.
Примечание
Версии, доступные по тегу general:deprecated
, с выходом новых моделей перестают поддерживаться: SpeechKit гарантирует две недели поддержки предыдущей версии со дня обновления версии по тегу general
. Список изменений доступен в разделе История изменений в сервисе распознавания Yandex SpeechKit.
Для асинхронного распознавания также доступен тег deferred-general
. Подробнее об режимах работы асинхронного распознавания.
Поддерживаемые языки распознавания
Используемый язык указывайте в формате ISO 639-1
Код | Язык |
---|---|
auto |
автоматическое распознавание языка |
de-DE |
немецкий |
en-US |
английский |
es-ES |
испанский |
fi-FI |
финский |
fr-FR |
французский |
he-HE |
иврит |
it-IT |
итальянский |
kk-KZ |
казахский |
nl-NL |
голландский |
pl-PL |
польский |
pt-PT |
португальский |
pt-BR |
бразильский португальский |
ru-RU |
русский язык (по умолчанию) |
sv-SE |
шведский |
tr-TR |
турецкий |
uz-UZ |
узбекский (латиница) |
Точность распознавания
В сервисе Yandex DataSphere вы можете самостоятельно оценить качество распознавания модели SpeechKit на ваших данных.