История изменений в сервисе распознавания Yandex SpeechKit
- Текущая версия
- Предыдущие версии
- Релиз 09.08.24
- Релиз 26.06.24
- Релиз 03.06.24
- Релиз 23.04.24
- Релиз 09.04.24
- Релиз 27.03.24
- Релиз 28.02.24
- Релиз 27.02.24
- Релиз 12.01.24
- Релиз 12.01.24
- Релиз 29.12.23
- Релиз 22.11.23
- Релиз 10.11.23
- Релиз 06.09.23
- Релиз 15.08.23
- Релиз 20.07.23
- Релиз 07.07.23
- Релиз 13.06.23
- Релиз 07.06.23
- Релиз 25.05.23
- Релиз 17.05.23
- Релиз 14.04.23
- Релиз 16.03.23
- Релиз 07.03.23
- Релиз 08.02.23
- Релиз 20.12.22
- Релиз 20.10.22
- Релиз 05.10.22
- Релиз 20.09.22
- Релиз 29.06.22
- Релиз 07.06.22
- Релиз 25.04.22
- Релиз 19.04.22
- Релиз 14.03.22
- Релиз 02.03.22
- Релиз 17.02.22
- Релиз 3.02.22
- Релиз 26.01.22
Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.
Подробнее о способах распознавания речи читайте в разделе О технологии.
Текущая версия
Релиз 31.10.24
В general:rc
улучшено качество распознавания речи на узбекском и турецком языках.
Предыдущие версии
Релиз 09.08.24
В general:rc
доступны следующие изменения:
- Улучшено качество распознавания речи на узбекском и казахском языках.
- Теперь можно ограничить языки распознавания, указав в поле
language_restriction
несколько значений.
Релиз 26.06.24
Изменения general:rc
от 3 июня стали доступны в модели general
.
В general:rc
улучшено качество распознавания узбекского языка.
Релиз 03.06.24
По запросам пользователей в general:rc
для русского языка улучшено качество распознавания аббревиатур и медицинских терминов.
Релиз 23.04.24
Изменения general:rc
от 9 апреля стали доступны в модели general
.
Релиз 09.04.24
В general:rc
изменился формат классификаторов. Теперь классификаторы formal_greeting
, informal_greeting
, formal_farewell
, informal_farewell
, insult
и profanity
возвращают результат в виде вероятности срабатывания. Классификаторы answerphone
и negative
теперь возвращают только вероятность срабатывания вместо вероятностей принадлежности двум классам.
Релиз 27.03.24
Все изменения general:rc
от 28 февраля стали доступны в модели general
.
В general:rc
доступны следующие обновления:
- Улучшено качество распознавания речи на узбекском языке.
- Улучшено качество определения дикторов в результатах распознавания.
Релиз 28.02.24
В general:rc
доступны следующие обновления:
- Улучшено качество распознавания для узбекского языка.
- По запросам пользователей для русского языка улучшено качество распознавания лекарств, марок автомобилей и табачной продукции.
Релиз 27.02.24
Все изменения general:rc
стали доступны в модели general
.
Релиз 12.01.24
В general:rc
добавлена поддержка определения дикторов в результатах распознавания.
Релиз 12.01.24
В general:rc
улучшено качество распознавания речи на узбекском языке.
Релиз 29.12.23
В general:rc
доступны следующие обновления:
-
Исправлены ошибки нормализации некоторых форм чисел (например, полторы тысячи ⟶ 1500).
-
Появилась поддержка следующих классификаторов:
- классификатор пола
gender
. Результатом классификации являются вероятности для классовmale
иfemale
. - классификатор негатива
negative
. Результат классификации — вероятности для классовnegative
иnot_negative
. - классификатор автоответчика
answerphone
. В результате классификации возвращаются вероятности для классовanswerphone
иnot_answerphone
.
- классификатор пола
-
Добавлено срабатывание классификаторов в частичных ответах распознавания (событие
ON_PARTIAL
).
Релиз 22.11.23
Все изменения general:rc
стали доступны в модели general
.
Релиз 10.11.23
В general:rc
доступны следующие изменения:
- Обновлена модель распознавания речи на русском языке.
- По запросам пользователей улучшено качество распознавания названий городов Республики Казахстан.
- Улучшено качество нормализации результатов распознавания речи на казахском языке.
- Исправлены внутренние ошибки сервера, возникающие при работе с маленькими фрагментами аудио.
Релиз 06.09.23
В general:rc
доступны следующие изменения:
- Исправлена проблема с появлением английских слов в распознавании русскоязычной модели.
- Улучшено общее качество распознавания на русском языке.
- Улучшено качество распознавания русской модели по запросам от пользователей.
- Улучшено общее качество распознавания на узбекском языке.
Классификаторы аудио, появившиеся в general:rc
в релизе от 15.08.23, стали доступны в general
.
Релиз 15.08.23
В general:rc
появилась поддержка классификаторов аудио.
Релиз 20.07.23
Исправление ресемплинга и новые метрики диалога доступны в модели general
.
Релиз 07.07.23
В general:rc
доступны следующие изменения:
- Исправлена ошибка ресемплинга двухканальных аудио в API v3.
- Добавлена возможность подсчета метрик диалога для речевой аналитики. Подсчет метрик настраивается с помощью опции
speech_analysis
в сообщенииStreamingOptions
.
Релиз 13.06.23
В general:rc
исправлены переключения на английский язык при распознавании русского языка.
Релиз 07.06.23
В general:rc
доступны следующие изменения:
- Улучшено качество распознавания на узбекском, немецком, французском, голландском, итальянском, польском языках и иврите.
- Добавлена нормализация чисел для узбекского языка.
- В режиме FullData появилась поддержка разделения текста на фразы сообщением
eou_update
.
Релиз 25.05.23
Изменения релиза от 17 мая стали доступны в модели general
.
Релиз 17.05.23
В general:rc
доступны следующие изменения:
- Улучшено общее качество распознавания на русском языке.
- Улучшено качество распознавания русской модели по запросам от пользователей.
- Улучшено качество распознавания на иностранных языках (узбекский, немецкий, французский, нидерландский, итальянский, польский).
- Доступен новый язык распознавания иврит
he-HE
.
Релиз 14.04.23
Для модели general:rc
улучшено качество распознавания русской модели на клиентских сценариях в части распознавания аббревиатур.
Релиз 16.03.23
Изменения релиза от 7 марта стали доступны в модели general
.
Релиз 07.03.23
Для модели general:rc
:
- Улучшено качество распознавания на узбекском языке.
- Добавлена нормализация чисел при распознавании речи на английском, немецком, французском, итальянском, испанском и турецком языках. Также в тестовом режиме добавлена нормализация чисел для речи на казахском языке.
Релиз 08.02.23
- В модели
general:rc
для всех версий API доступна первая версия распознавания на узбекском языке. Пока при некоторых акустических условиях узбекский язык может быть распознан как казахский. Эта проблема будет исправлена в следующих релизах модели. - Теперь чтобы обратиться к модели
general:rc
в API v3, передавайте это значение в параметреmodel
.
Релиз 20.12.22
В модели general:rc
:
- По обращениям пользователей улучшено качество распознавания названий лекарственных препаратов, фамилий, имен и отчеств.
- Немного улучшено качество распознавания на казахском и турецком языках.
Релиз 20.10.22
В модели general:rc
:
- Появилось распознавание бразильского варианта португальского языка, языковой код
pt-BR
. - Улучшено качество распознавания речи на всех языках в автоматическом режиме распознавания.
- Немного улучшено качество распознавания на русском и казахском языке.
Релиз 05.10.22
Изменения релиза от 20 сентября доступны в модели general
.
Релиз 20.09.22
В модели general:rc
:
- для русского языка улучшено качество распознавания районов Москвы и лекарственных препаратов.
- добавлена классификация языка в автоматическом режиме распознавания.
Исправления доступны для тестирования.
Релиз 29.06.22
- Многоязычная модель стала доступна в версии
general
. - В версиях
general:rc
иgeneral
многоязычная модель может принимать подсказки, какие языки присутствуют в речи. - В модели
general
для русского языка стали доступны изменения вgeneral:rc
от 7 июня.
Релиз 07.06.22
- В модели
general:rc
улучшено качество расстановки пунктуации и распознавание фамилий. - Изменения релиза от 25 апреля доступны в модели
general
.
Релиз 25.04.22
Изменения в модели general:rc
:
- Улучшено распознавание слов газификация и догазификация.
- Добавлена обратная связь сервиса при обработке формата OGG-OPUS. Если поток не является корректным аудио в формате OPUS, сервис возвращает
Invalid_Argument
.
Релиз 19.04.22
- В многоязычную модель распознавания речи добавлена поддержка турецкого языка.
- Новая версия API доступна для потокового распознавания Yandex SpeechKit. Старый интерфейс также будет поддерживаться, однако все новые возможности будут доступны только в API v3.
Релиз 14.03.22
Версия general:rc
от 2 марта 2022 года доступна по тегу general
.
Релиз 02.03.22
Улучшенное распознавание имен, адресов и терминов, а также расстановка пунктуации в длинных предложениях и текстах, содержащих цифры, стало доступно в модели general
.
В модель general:rc
внесены дальнейшие изменения на основе данных пользователей.
Релиз 17.02.22
В текущем релизе улучшено качество русскоязычной модели general:rc
в следующих направлениях:
- Распознавание фамилий, имен, отчеств и адресов.
- Распознавание специфичных для клиентов терминов. В модель внесены данные по запросу пользователя от 1 февраля 2022 года, добавлены исправления по данным пользователя от 9 ноября 2021 года.
- Расстановка пунктуации в длинных предложениях и текстах, содержащих цифры.
Релиз 3.02.22
-
В модели
general:rc
доступен универсальный режим (язык"auto"
). В этом режиме модель способна распознавать речь на одном из языков:- русский
- казахский
- английский
- немецкий
- французский
- финский
- шведский
- нидерландский
- польский
- португальский
- итальянский
- испанский
-
Новые языки также доступны под своими кодами. Модель
general:rc
использует указание как подсказку для распознавания языка. При явном указании языка модель будет использовать его как подсказку для улучшения качества распознавания. В данный момент подсказка влияет только на качество распознавания русского языка.
При работе с general:rc
рекомендуем включить автотюнинг.
Известные проблемы: в универсальном режиме качество распознавания может деградировать при распознавании непрерывной речи без пауз.
Релиз 26.01.22
-
Модель распознавания
general
иgeneral:rc
для казахского языка доступна в режимах потокового и отложенного распознавания. -
В модели
general:rc
в режимах потокового и отложенного распознавания появился пунктуатор. -
В режиме отложенного распознавания появилась поддержка работы с форматом MP3
.