Архив истории изменений в Yandex SpeechKit
Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.
Для распознавания
Подробное описание доступных версий находится в разделе Модели распознавания.
Для синтеза
В синтезе речи сервис предоставляет голоса двух типов: стандартные и премиум-голоса. В премиум-голосах используется новая технология синтеза.
Подробнее о голосовых моделях читайте в разделе О технологии.
Текущая версия
Информацию об обновлениях моделей синтеза см. на странице История изменений в сервисе синтеза Yandex SpeechKit.
Информацию об обновлениях моделей распознавания см. на странице История изменений в сервисе распознавания Yandex SpeechKit.
Предыдущие версии
Релиз 30.09.21
Крупное обновление премиум-голосов, доступных в REST API. Обновления голосов доступны под тегами alena:rc
и filipp:rc
.
Различные улучшения в качестве синтеза, в том числе в синтезе вопросительных фраз. Исправили редкую проблему с зацикливанием синтеза.
Для тестирования доступна функция — добавление акцентов на слова. Она позволит лучше контролировать интонацию, особенно при синтезе вопросительных фраз. Для выделения акцента после слова, которое необходимо выделить, добавьте <[accented]>
. Например, Вы рады <[accented]> меня видеть?
— акцент будет на слове рады.
Релиз 09.03.21
В потоковом распознавании, транскрибации и в распознавании коротких аудио по тегу general:rc
доступна новая версия модели Демосфен. В ней улучшили базовое качество распознавания, распознавание медицинских специальностей и лексики, связанной с ювелирными изделиями.
Приглашаем к тестированию и будем благодарны за обратную связь!
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Амати.
В стриминге, транскрибации и распознавании коротких аудио:
general
— версия Гален.general:rc
— версия Демосфен.general:deprecated
— версия Зенон.
Релиз 26.02.21
В транскрибации по тегу модели hqa
доступна новая версия Гварнери. В ней заметно улучшено качество распознавания.
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Гварнери.
В стриминге, транскрибации и распознавании коротких аудио:
general
— версия Гален.general:rc
— версия Гален.general:deprecated
— версия Зенон.
Релиз 03.02.21
Версия Гален базовой модели распознавания успешно прошла тестирование и с 3 февраля становится основной версией модели распознавания.
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Амати.
В стриминге, транскрибации и распознавании коротких аудио:
general
— версия Гален.general:rc
— версия Гален.general:deprecated
— версия Зенон.
Релиз 14.12.20
В транскрибации по тегу модели hqa
доступна новая версия Амати. В ней исправили случаи распознавания тишины вместо речи. Улучшили распознавание текстов из тематических доменов новостей и медицины.
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Амати.
В стриминге, транскрибации и распознавании коротких аудио:
general
— версия Зенон.general:rc
— версия Гален.general:deprecated
— версия Анаксимандр.
Релиз 01.12.20
В стриминге, транскрибации и в распознавании коротких аудио по тегу general:rc
доступна новая версия модели Гален. В ней улучшили базовое качество распознавания, а также распознавание слов, связанных с Covid-19.
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Страдивари.
В стриминге, транскрибации и распознавании коротких аудио:
general
— версия Зенон.general:rc
— версия Гален.general:deprecated
— версия Анаксимандр.
Релиз 24.11.20
После успешного тестирования версия Зенон стала основной рабочей версией модели general
в стриминге, транскрибации и распознавании коротких аудио.
Доступность версий по тегам
Только в транскрибации:
hqa
— версия Страдивари.
В стриминге, транскрибации и распознавании коротких аудио:
general
иgeneral:rc
— версия Зенон.general:deprecated
— версия Анаксимандр.
Релиз 17.11.20
Внесли много исправлений в произношение отдельных слов за счет улучшенного механизма нормализации. Исправили склонение числительных. А по тегу alena
доступна новая версия премиум-голоса alena
.
Доступность версий по тегам
Без изменений.
Релиз 26.10.20
В транскрибации доступна модель распознавания нового поколения — hqa
. У этой модели увеличенный словарный запас — результаты распознавания гораздо лучше, их легче воспринимать при чтении. Особенно этот эффект видно при распознавании длинных аудио.
Доступность версий по тегам
В транскрибации:
hqa
— версия Страдивари.general
— версия Анаксимандр.general:rc
— версия Зенон.general:deprecated
— Марк Аврелий.
В стриминге и распознавании коротких аудио — без изменений.
Релиз 12.10.20
В новой версии существенно улучшили базовое качество распознавания. Новая версия модели general
теперь доступна в стриминге, транскрибации, распознавании коротких аудио.
Доступность версий по тегам
general
— версия Анаксимандр.general:rc
— версия Зенон.general:deprecated
— Марк Аврелий.
Релиз 18.08.20
Обновили версию Анаксимандр в транскрибации:
- Улучшили работу с плотным потоком речи: когда в отрезках больше, чем 30 секунд, теперь нет заметных пауз.
- Поправили работу тайминга.
- Исправили ошибку с приходом частичных результатов распознавания уже после получения финального результата.
Акустические и языковые свойства модели остались прежними.
Доступность версий по тегам
Эти версии доступны для потокового распознавания, транскрибации и распознавания коротких аудио:
general
— версия Анаксимандр.general:rc
— версия Анаксимандр (обновленная).general:deprecated
— версия Марк Аврелий.
Релиз 21.07.20
Теперь Анаксимандр — основная эксплуатируемая версия для потокового распознавания, транскрибации и распознавания коротких аудио.
Доступность версий по тегам
general
иgeneral:rc
— версия Анаксимандр.general:deprecated
— версия Марк Аврелий.
Релиз 27.05.20
Новые версии модели general
теперь доступны в транскрибации и в распознавании коротких аудио.
Доступность версий по тегам
Доступные версии по тегам:
general:rc
— версия Анаксимандр.general
иgeneral:deprecated
— версия Марк Аврелий.
Доступные для потокового распознавания версии модели general
:
general
— версия Марк Аврелий.general:rc
— версия Анаксимандр.general:deprecated
— версия Диоген.
Релиз 15.05.20
Для потокового распознавания по тегу general:rc
стала доступна новая версия модели Анаксимандр.
Доступность версий по тегам
general
— версия Марк Аврелий.general:rc
— версия Анаксимандр.general:deprecated
— версия Диоген.
Версии для распознавания коротких и длинных аудио остались без изменений.
Релиз 16.04.20
Для потокового распознавания по тегу general
стала доступна новая версия модели Марк Аврелий.
Доступность версий по тегам
general
иgeneral:rc
— версия Марк Аврелий.general:deprecated
— версия Диоген.
Версии для распознавания коротких и длинных аудио, доступные по тегу general
, остались без изменений.