Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • AI Studio
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Страница сервиса
Yandex SpeechKit
Документация
Yandex SpeechKit
  • Обзор технологий SpeechKit
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails
    • Релизы распознавания
    • Релизы синтеза

В этой статье:

  • Релиз 31.07.2025
  • Релиз 24.04.2025
  • Релиз 11.04.2025
  • Релиз 05.03.2025
  • Релиз 17.12.2024
  • Релиз 10.12.2024
  • Релиз 03.12.2024
  • Релиз 31.10.24
  • Релиз 09.08.24
  • Релиз 26.06.24
  • Релиз 03.06.24
  • Релиз 23.04.24
  • Релиз 09.04.24
  • Релиз 27.03.24
  • Релиз 28.02.24
  • Релиз 27.02.24
  • Релиз 12.01.24
  • Релиз 12.01.24
  • Релиз 29.12.23
  • Релиз 22.11.23
  • Релиз 10.11.23
  • Релиз 06.09.23
  • Релиз 15.08.23
  • Релиз 20.07.23
  • Релиз 07.07.23
  • Релиз 13.06.23
  • Релиз 07.06.23
  • Релиз 25.05.23
  • Релиз 17.05.23
  • Релиз 14.04.23
  • Релиз 16.03.23
  • Релиз 07.03.23
  • Релиз 08.02.23
  • Релиз 20.12.22
  • Релиз 20.10.22
  • Релиз 05.10.22
  • Релиз 20.09.22
  • Релиз 29.06.22
  • Релиз 07.06.22
  • Релиз 25.04.22
  • Релиз 19.04.22
  • Релиз 14.03.22
  • Релиз 02.03.22
  • Релиз 17.02.22
  • Релиз 3.02.22
  • Релиз 26.01.22
  1. История изменений
  2. Релизы распознавания

История изменений в сервисе распознавания Yandex SpeechKit

Статья создана
Yandex Cloud
Обновлена 31 июля 2025 г.
  • Релиз 31.07.2025
  • Релиз 24.04.2025
  • Релиз 11.04.2025
  • Релиз 05.03.2025
  • Релиз 17.12.2024
  • Релиз 10.12.2024
  • Релиз 03.12.2024
  • Релиз 31.10.24
  • Релиз 09.08.24
  • Релиз 26.06.24
  • Релиз 03.06.24
  • Релиз 23.04.24
  • Релиз 09.04.24
  • Релиз 27.03.24
  • Релиз 28.02.24
  • Релиз 27.02.24
  • Релиз 12.01.24
  • Релиз 12.01.24
  • Релиз 29.12.23
  • Релиз 22.11.23
  • Релиз 10.11.23
  • Релиз 06.09.23
  • Релиз 15.08.23
  • Релиз 20.07.23
  • Релиз 07.07.23
  • Релиз 13.06.23
  • Релиз 07.06.23
  • Релиз 25.05.23
  • Релиз 17.05.23
  • Релиз 14.04.23
  • Релиз 16.03.23
  • Релиз 07.03.23
  • Релиз 08.02.23
  • Релиз 20.12.22
  • Релиз 20.10.22
  • Релиз 05.10.22
  • Релиз 20.09.22
  • Релиз 29.06.22
  • Релиз 07.06.22
  • Релиз 25.04.22
  • Релиз 19.04.22
  • Релиз 14.03.22
  • Релиз 02.03.22
  • Релиз 17.02.22
  • Релиз 3.02.22
  • Релиз 26.01.22

Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.

Подробнее о способах распознавания речи читайте в разделе О технологии.

Релиз 31.07.2025Релиз 31.07.2025

Добавлена возможность обращаться к генеративным текстовым моделям в запросах на распознавание. Подробнее об этой возможности см. раздел Обработка результатов распознавания с помощью LLM.

Релиз 24.04.2025Релиз 24.04.2025

В general:rc доступны следующие изменения:

  • улучшено качество распознавания на узбекском языке.
  • улучшено качество распознавания медицинской тематики на русском языке.

Релиз 11.04.2025Релиз 11.04.2025

Изменения general:rc стали доступны в модели general.

Релиз 05.03.2025Релиз 05.03.2025

В general:rc улучшено качество распознавания речи на узбекском и русском языках

Релиз 17.12.2024Релиз 17.12.2024

В general:rc улучшено качество распознавания речи на узбекском и казахском языках.

Релиз 10.12.2024Релиз 10.12.2024

Изменения general:rc от 3 декабря стали доступны в модели general.

Релиз 03.12.2024Релиз 03.12.2024

В general:rc исправлены и улучшены сообщения об ошибках при использовании неподдерживаемых языков распознавания и форматов аудио.

Релиз 31.10.24Релиз 31.10.24

В general:rc улучшено качество распознавания речи на узбекском и турецком языках.

Релиз 09.08.24Релиз 09.08.24

В general:rc доступны следующие изменения:

  • Улучшено качество распознавания речи на узбекском и казахском языках.
  • Теперь можно ограничить языки распознавания, указав в поле language_restriction несколько значений.

Релиз 26.06.24Релиз 26.06.24

Изменения general:rc от 3 июня стали доступны в модели general.

В general:rc улучшено качество распознавания узбекского языка.

Релиз 03.06.24Релиз 03.06.24

По запросам пользователей в general:rc для русского языка улучшено качество распознавания аббревиатур и медицинских терминов.

Релиз 23.04.24Релиз 23.04.24

Изменения general:rc от 9 апреля стали доступны в модели general.

Релиз 09.04.24Релиз 09.04.24

В general:rc изменился формат классификаторов. Теперь классификаторы formal_greeting, informal_greeting, formal_farewell, informal_farewell, insult и profanity возвращают результат в виде вероятности срабатывания. Классификаторы answerphone и negative теперь возвращают только вероятность срабатывания вместо вероятностей принадлежности двум классам.

Релиз 27.03.24Релиз 27.03.24

Все изменения general:rc от 28 февраля стали доступны в модели general.

В general:rc доступны следующие обновления:

  • Улучшено качество распознавания речи на узбекском языке.
  • Улучшено качество определения дикторов в результатах распознавания.

Релиз 28.02.24Релиз 28.02.24

В general:rc доступны следующие обновления:

  • Улучшено качество распознавания для узбекского языка.
  • По запросам пользователей для русского языка улучшено качество распознавания лекарств, марок автомобилей и табачной продукции.

Релиз 27.02.24Релиз 27.02.24

Все изменения general:rc стали доступны в модели general.

Релиз 12.01.24Релиз 12.01.24

В general:rc добавлена поддержка определения дикторов в результатах распознавания.

Релиз 12.01.24Релиз 12.01.24

В general:rc улучшено качество распознавания речи на узбекском языке.

Релиз 29.12.23Релиз 29.12.23

В general:rc доступны следующие обновления:

  1. Исправлены ошибки нормализации некоторых форм чисел (например, полторы тысячи ⟶ 1500).

  2. Появилась поддержка следующих классификаторов:

    • классификатор пола gender. Результатом классификации являются вероятности для классов male и female.
    • классификатор негатива negative. Результат классификации — вероятности для классов negative и not_negative.
    • классификатор автоответчика answerphone. В результате классификации возвращаются вероятности для классов answerphone и not_answerphone.
  3. Добавлено срабатывание классификаторов в частичных ответах распознавания (событие ON_PARTIAL).

Релиз 22.11.23Релиз 22.11.23

Все изменения general:rc стали доступны в модели general.

Релиз 10.11.23Релиз 10.11.23

В general:rc доступны следующие изменения:

  • Обновлена модель распознавания речи на русском языке.
  • По запросам пользователей улучшено качество распознавания названий городов Республики Казахстан.
  • Улучшено качество нормализации результатов распознавания речи на казахском языке.
  • Исправлены внутренние ошибки сервера, возникающие при работе с маленькими фрагментами аудио.

Релиз 06.09.23Релиз 06.09.23

В general:rc доступны следующие изменения:

  • Исправлена проблема с появлением английских слов в распознавании русскоязычной модели.
  • Улучшено общее качество распознавания на русском языке.
  • Улучшено качество распознавания русской модели по запросам от пользователей.
  • Улучшено общее качество распознавания на узбекском языке.

Классификаторы аудио, появившиеся в general:rc в релизе от 15.08.23, стали доступны в general.

Релиз 15.08.23Релиз 15.08.23

В general:rc появилась поддержка классификаторов аудио.

Релиз 20.07.23Релиз 20.07.23

Исправление ресемплинга и новые метрики диалога доступны в модели general.

Релиз 07.07.23Релиз 07.07.23

В general:rc доступны следующие изменения:

  • Исправлена ошибка ресемплинга двухканальных аудио в API v3.
  • Добавлена возможность подсчета метрик диалога для речевой аналитики. Подсчет метрик настраивается с помощью опции speech_analysis в сообщении StreamingOptions.

Релиз 13.06.23Релиз 13.06.23

В general:rc исправлены переключения на английский язык при распознавании русского языка.

Релиз 07.06.23Релиз 07.06.23

В general:rc доступны следующие изменения:

  • Улучшено качество распознавания на узбекском, немецком, французском, голландском, итальянском, польском языках и иврите.
  • Добавлена нормализация чисел для узбекского языка.
  • В режиме FullData появилась поддержка разделения текста на фразы сообщением eou_update.

Релиз 25.05.23Релиз 25.05.23

Изменения релиза от 17 мая стали доступны в модели general.

Релиз 17.05.23Релиз 17.05.23

В general:rc доступны следующие изменения:

  • Улучшено общее качество распознавания на русском языке.
  • Улучшено качество распознавания русской модели по запросам от пользователей.
  • Улучшено качество распознавания на иностранных языках (узбекский, немецкий, французский, нидерландский, итальянский, польский).
  • Доступен новый язык распознавания иврит he-HE.

Релиз 14.04.23Релиз 14.04.23

Для модели general:rc улучшено качество распознавания русской модели на клиентских сценариях в части распознавания аббревиатур.

Релиз 16.03.23Релиз 16.03.23

Изменения релиза от 7 марта стали доступны в модели general.

Релиз 07.03.23Релиз 07.03.23

Для модели general:rc:

  1. Улучшено качество распознавания на узбекском языке.
  2. Добавлена нормализация чисел при распознавании речи на английском, немецком, французском, итальянском, испанском и турецком языках. Также в тестовом режиме добавлена нормализация чисел для речи на казахском языке.

Релиз 08.02.23Релиз 08.02.23

  1. В модели general:rc для всех версий API доступна первая версия распознавания на узбекском языке. Пока при некоторых акустических условиях узбекский язык может быть распознан как казахский. Эта проблема будет исправлена в следующих релизах модели.
  2. Теперь чтобы обратиться к модели general:rc в API v3, передавайте это значение в параметре model.

Релиз 20.12.22Релиз 20.12.22

В модели general:rc:

  1. По обращениям пользователей улучшено качество распознавания названий лекарственных препаратов, фамилий, имен и отчеств.
  2. Немного улучшено качество распознавания на казахском и турецком языках.

Релиз 20.10.22Релиз 20.10.22

В модели general:rc:

  1. Появилось распознавание бразильского варианта португальского языка, языковой код pt-BR.
  2. Улучшено качество распознавания речи на всех языках в автоматическом режиме распознавания.
  3. Немного улучшено качество распознавания на русском и казахском языке.

Релиз 05.10.22Релиз 05.10.22

Изменения релиза от 20 сентября доступны в модели general.

Релиз 20.09.22Релиз 20.09.22

В модели general:rc:

  • для русского языка улучшено качество распознавания районов Москвы и лекарственных препаратов.
  • добавлена классификация языка в автоматическом режиме распознавания.

Исправления доступны для тестирования.

Релиз 29.06.22Релиз 29.06.22

  1. Многоязычная модель стала доступна в версии general.
  2. В версиях general:rc и general многоязычная модель может принимать подсказки, какие языки присутствуют в речи.
  3. В модели general для русского языка стали доступны изменения в general:rc от 7 июня.

Релиз 07.06.22Релиз 07.06.22

  1. В модели general:rc улучшено качество расстановки пунктуации и распознавание фамилий.
  2. Изменения релиза от 25 апреля доступны в модели general.

Релиз 25.04.22Релиз 25.04.22

Изменения в модели general:rc:

  1. Улучшено распознавание слов газификация и догазификация.
  2. Добавлена обратная связь сервиса при обработке формата OGG-OPUS. Если поток не является корректным аудио в формате OPUS, сервис возвращает Invalid_Argument.

Релиз 19.04.22Релиз 19.04.22

  1. В многоязычную модель распознавания речи добавлена поддержка турецкого языка.
  2. Новая версия API доступна для потокового распознавания Yandex SpeechKit. Старый интерфейс также будет поддерживаться, однако все новые возможности будут доступны только в API v3.

Релиз 14.03.22Релиз 14.03.22

Версия general:rc от 2 марта 2022 года доступна по тегу general.

Релиз 02.03.22Релиз 02.03.22

Улучшенное распознавание имен, адресов и терминов, а также расстановка пунктуации в длинных предложениях и текстах, содержащих цифры, стало доступно в модели general.

В модель general:rc внесены дальнейшие изменения на основе данных пользователей.

Релиз 17.02.22Релиз 17.02.22

В текущем релизе улучшено качество русскоязычной модели general:rc в следующих направлениях:

  1. Распознавание фамилий, имен, отчеств и адресов.
  2. Распознавание специфичных для клиентов терминов. В модель внесены данные по запросу пользователя от 1 февраля 2022 года, добавлены исправления по данным пользователя от 9 ноября 2021 года.
  3. Расстановка пунктуации в длинных предложениях и текстах, содержащих цифры.

Релиз 3.02.22Релиз 3.02.22

  1. В модели general:rc доступен универсальный режим (язык "auto"). В этом режиме модель способна распознавать речь на одном из языков:

    • русский
    • казахский
    • английский
    • немецкий
    • французский
    • финский
    • шведский
    • нидерландский
    • польский
    • португальский
    • итальянский
    • испанский
  2. Новые языки также доступны под своими кодами. Модель general:rc использует указание как подсказку для распознавания языка. При явном указании языка модель будет использовать его как подсказку для улучшения качества распознавания. В данный момент подсказка влияет только на качество распознавания русского языка.

При работе с general:rc рекомендуем включить автотюнинг.

Известные проблемы: в универсальном режиме качество распознавания может деградировать при распознавании непрерывной речи без пауз.

Релиз 26.01.22Релиз 26.01.22

  1. Модель распознавания general и general:rc для казахского языка доступна в режимах потокового и отложенного распознавания.

  2. В модели general:rc в режимах потокового и отложенного распознавания появился пунктуатор.

  3. В режиме отложенного распознавания появилась поддержка работы с форматом MP3.

Была ли статья полезна?

Предыдущая
Аудитные логи Audit Trails
Следующая
Релизы синтеза
Проект Яндекса
© 2025 ООО «Яндекс.Облако»