История изменений в сервисе распознавания Yandex SpeechKit
- Релиз 01.10.2025
- Релиз 19.09.2025
- Релиз 31.07.2025
- Релиз 24.04.2025
- Релиз 11.04.2025
- Релиз 05.03.2025
- Релиз 17.12.2024
- Релиз 10.12.2024
- Релиз 03.12.2024
- Релиз 31.10.24
- Релиз 09.08.24
- Релиз 26.06.24
- Релиз 03.06.24
- Релиз 23.04.24
- Релиз 09.04.24
- Релиз 27.03.24
- Релиз 28.02.24
- Релиз 27.02.24
- Релиз 12.01.24
- Релиз 12.01.24
- Релиз 29.12.23
- Релиз 22.11.23
- Релиз 10.11.23
- Релиз 06.09.23
- Релиз 15.08.23
- Релиз 20.07.23
- Релиз 07.07.23
- Релиз 13.06.23
- Релиз 07.06.23
- Релиз 25.05.23
- Релиз 17.05.23
- Релиз 14.04.23
- Релиз 16.03.23
- Релиз 07.03.23
- Релиз 08.02.23
- Релиз 20.12.22
- Релиз 20.10.22
- Релиз 05.10.22
- Релиз 20.09.22
- Релиз 29.06.22
- Релиз 07.06.22
- Релиз 25.04.22
- Релиз 19.04.22
- Релиз 14.03.22
- Релиз 02.03.22
- Релиз 17.02.22
- Релиз 3.02.22
- Релиз 26.01.22
Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.
Подробнее о способах распознавания речи читайте в разделе О технологии.
Релиз 01.10.2025
Изменения general:rc стали доступны в модели general.
Релиз 19.09.2025
В general:rc доступны следующие изменения:
- Улучшено качество распознавания русского и узбекского языков на некоторых клиентских сценариях.
- Улучшено качество классификации автоответчиков.
- Исправлены проблемы с дублированием и склейкой слов в распознавании.
Релиз 31.07.2025
Добавлена возможность обращаться к генеративным текстовым моделям в запросах на распознавание. Подробнее об этой возможности см. раздел Обработка результатов распознавания с помощью LLM.
Релиз 24.04.2025
В general:rc доступны следующие изменения:
- улучшено качество распознавания на узбекском языке.
- улучшено качество распознавания медицинской тематики на русском языке.
Релиз 11.04.2025
Изменения general:rc стали доступны в модели general.
Релиз 05.03.2025
В general:rc улучшено качество распознавания речи на узбекском и русском языках
Релиз 17.12.2024
В general:rc улучшено качество распознавания речи на узбекском и казахском языках.
Релиз 10.12.2024
Изменения general:rc от 3 декабря стали доступны в модели general.
Релиз 03.12.2024
В general:rc исправлены и улучшены сообщения об ошибках при использовании неподдерживаемых языков распознавания и форматов аудио.
Релиз 31.10.24
В general:rc улучшено качество распознавания речи на узбекском и турецком языках.
Релиз 09.08.24
В general:rc доступны следующие изменения:
- Улучшено качество распознавания речи на узбекском и казахском языках.
- Теперь можно ограничить языки распознавания, указав в поле
language_restrictionнесколько значений.
Релиз 26.06.24
Изменения general:rc от 3 июня стали доступны в модели general.
В general:rc улучшено качество распознавания узбекского языка.
Релиз 03.06.24
По запросам пользователей в general:rc для русского языка улучшено качество распознавания аббревиатур и медицинских терминов.
Релиз 23.04.24
Изменения general:rc от 9 апреля стали доступны в модели general.
Релиз 09.04.24
В general:rc изменился формат классификаторов. Теперь классификаторы formal_greeting, informal_greeting, formal_farewell, informal_farewell, insult и profanity возвращают результат в виде вероятности срабатывания. Классификаторы answerphone и negative теперь возвращают только вероятность срабатывания вместо вероятностей принадлежности двум классам.
Релиз 27.03.24
Все изменения general:rc от 28 февраля стали доступны в модели general.
В general:rc доступны следующие обновления:
- Улучшено качество распознавания речи на узбекском языке.
- Улучшено качество определения дикторов в результатах распознавания.
Релиз 28.02.24
В general:rc доступны следующие обновления:
- Улучшено качество распознавания для узбекского языка.
- По запросам пользователей для русского языка улучшено качество распознавания лекарств, марок автомобилей и табачной продукции.
Релиз 27.02.24
Все изменения general:rc стали доступны в модели general.
Релиз 12.01.24
В general:rc добавлена поддержка определения дикторов в результатах распознавания.
Релиз 12.01.24
В general:rc улучшено качество распознавания речи на узбекском языке.
Релиз 29.12.23
В general:rc доступны следующие обновления:
-
Исправлены ошибки нормализации некоторых форм чисел (например, полторы тысячи ⟶ 1500).
-
Появилась поддержка следующих классификаторов:
- классификатор пола
gender. Результатом классификации являются вероятности для классовmaleиfemale. - классификатор негатива
negative. Результат классификации — вероятности для классовnegativeиnot_negative. - классификатор автоответчика
answerphone. В результате классификации возвращаются вероятности для классовanswerphoneиnot_answerphone.
- классификатор пола
-
Добавлено срабатывание классификаторов в частичных ответах распознавания (событие
ON_PARTIAL).
Релиз 22.11.23
Все изменения general:rc стали доступны в модели general.
Релиз 10.11.23
В general:rc доступны следующие изменения:
- Обновлена модель распознавания речи на русском языке.
- По запросам пользователей улучшено качество распознавания названий городов Республики Казахстан.
- Улучшено качество нормализации результатов распознавания речи на казахском языке.
- Исправлены внутренние ошибки сервера, возникающие при работе с маленькими фрагментами аудио.
Релиз 06.09.23
В general:rc доступны следующие изменения:
- Исправлена проблема с появлением английских слов в распознавании русскоязычной модели.
- Улучшено общее качество распознавания на русском языке.
- Улучшено качество распознавания русской модели по запросам от пользователей.
- Улучшено общее качество распознавания на узбекском языке.
Классификаторы аудио, появившиеся в general:rc в релизе от 15.08.23, стали доступны в general.
Релиз 15.08.23
В general:rc появилась поддержка классификаторов аудио.
Релиз 20.07.23
Исправление ресемплинга и новые метрики диалога доступны в модели general.
Релиз 07.07.23
В general:rc доступны следующие изменения:
- Исправлена ошибка ресемплинга двухканальных аудио в API v3.
- Добавлена возможность подсчета метрик диалога для речевой аналитики. Подсчет метрик настраивается с помощью опции
speech_analysisв сообщенииStreamingOptions.
Релиз 13.06.23
В general:rc исправлены переключения на английский язык при распознавании русского языка.
Релиз 07.06.23
В general:rc доступны следующие изменения:
- Улучшено качество распознавания на узбекском, немецком, французском, голландском, итальянском, польском языках и иврите.
- Добавлена нормализация чисел для узбекского языка.
- В режиме FullData появилась поддержка разделения текста на фразы сообщением
eou_update.
Релиз 25.05.23
Изменения релиза от 17 мая стали доступны в модели general.
Релиз 17.05.23
В general:rc доступны следующие изменения:
- Улучшено общее качество распознавания на русском языке.
- Улучшено качество распознавания русской модели по запросам от пользователей.
- Улучшено качество распознавания на иностранных языках (узбекский, немецкий, французский, нидерландский, итальянский, польский).
- Доступен новый язык распознавания иврит
he-HE.
Релиз 14.04.23
Для модели general:rc улучшено качество распознавания русской модели на клиентских сценариях в части распознавания аббревиатур.
Релиз 16.03.23
Изменения релиза от 7 марта стали доступны в модели general.
Релиз 07.03.23
Для модели general:rc:
- Улучшено качество распознавания на узбекском языке.
- Добавлена нормализация чисел при распознавании речи на английском, немецком, французском, итальянском, испанском и турецком языках. Также в тестовом режиме добавлена нормализация чисел для речи на казахском языке.
Релиз 08.02.23
- В модели
general:rcдля всех версий API доступна первая версия распознавания на узбекском языке. Пока при некоторых акустических условиях узбекский язык может быть распознан как казахский. Эта проблема будет исправлена в следующих релизах модели. - Теперь чтобы обратиться к модели
general:rcв API v3, передавайте это значение в параметреmodel.
Релиз 20.12.22
В модели general:rc:
- По обращениям пользователей улучшено качество распознавания названий лекарственных препаратов, фамилий, имен и отчеств.
- Немного улучшено качество распознавания на казахском и турецком языках.
Релиз 20.10.22
В модели general:rc:
- Появилось распознавание бразильского варианта португальского языка, языковой код
pt-BR. - Улучшено качество распознавания речи на всех языках в автоматическом режиме распознавания.
- Немного улучшено качество распознавания на русском и казахском языке.
Релиз 05.10.22
Изменения релиза от 20 сентября доступны в модели general.
Релиз 20.09.22
В модели general:rc:
- для русского языка улучшено качество распознавания районов Москвы и лекарственных препаратов.
- добавлена классификация языка в автоматическом режиме распознавания.
Исправления доступны для тестирования.
Релиз 29.06.22
- Многоязычная модель стала доступна в версии
general. - В версиях
general:rcиgeneralмногоязычная модель может принимать подсказки, какие языки присутствуют в речи. - В модели
generalдля русского языка стали доступны изменения вgeneral:rcот 7 июня.
Релиз 07.06.22
- В модели
general:rcулучшено качество расстановки пунктуации и распознавание фамилий. - Изменения релиза от 25 апреля доступны в модели
general.
Релиз 25.04.22
Изменения в модели general:rc:
- Улучшено распознавание слов газификация и догазификация.
- Добавлена обратная связь сервиса при обработке формата OGG-OPUS. Если поток не является корректным аудио в формате OPUS, сервис возвращает
Invalid_Argument.
Релиз 19.04.22
- В многоязычную модель распознавания речи добавлена поддержка турецкого языка.
- Новая версия API доступна для потокового распознавания Yandex SpeechKit. Старый интерфейс также будет поддерживаться, однако все новые возможности будут доступны только в API v3.
Релиз 14.03.22
Версия general:rc от 2 марта 2022 года доступна по тегу general.
Релиз 02.03.22
Улучшенное распознавание имен, адресов и терминов, а также расстановка пунктуации в длинных предложениях и текстах, содержащих цифры, стало доступно в модели general.
В модель general:rc внесены дальнейшие изменения на основе данных пользователей.
Релиз 17.02.22
В текущем релизе улучшено качество русскоязычной модели general:rc в следующих направлениях:
- Распознавание фамилий, имен, отчеств и адресов.
- Распознавание специфичных для клиентов терминов. В модель внесены данные по запросу пользователя от 1 февраля 2022 года, добавлены исправления по данным пользователя от 9 ноября 2021 года.
- Расстановка пунктуации в длинных предложениях и текстах, содержащих цифры.
Релиз 3.02.22
-
В модели
general:rcдоступен универсальный режим (язык"auto"). В этом режиме модель способна распознавать речь на одном из языков:- русский
- казахский
- английский
- немецкий
- французский
- финский
- шведский
- нидерландский
- польский
- португальский
- итальянский
- испанский
-
Новые языки также доступны под своими кодами. Модель
general:rcиспользует указание как подсказку для распознавания языка. При явном указании языка модель будет использовать его как подсказку для улучшения качества распознавания. В данный момент подсказка влияет только на качество распознавания русского языка.
При работе с general:rc рекомендуем включить автотюнинг.
Известные проблемы: в универсальном режиме качество распознавания может деградировать при распознавании непрерывной речи без пауз.
Релиз 26.01.22
-
Модель распознавания
generalиgeneral:rcдля казахского языка доступна в режимах потокового и отложенного распознавания. -
В модели
general:rcв режимах потокового и отложенного распознавания появился пунктуатор. -
В режиме отложенного распознавания появилась поддержка работы с форматом MP3
.