Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
    • Релизы распознавания
    • Релизы синтеза
    • Архив релизов

В этой статье:

  • Текущая версия
  • Предыдущие версии
  • Релиз 30.09.21
  • Релиз 09.03.21
  • Релиз 26.02.21
  • Релиз 03.02.21
  • Релиз 14.12.20
  • Релиз 01.12.20
  • Релиз 24.11.20
  • Релиз 17.11.20
  • Релиз 26.10.20
  • Релиз 12.10.20
  • Релиз 18.08.20
  • Релиз 21.07.20
  • Релиз 27.05.20
  • Релиз 15.05.20
  • Релиз 16.04.20
  1. История изменений
  2. Архив релизов

Архив истории изменений в Yandex SpeechKit

Статья создана
Yandex Cloud
Обновлена 13 августа 2024 г.
  • Текущая версия
  • Предыдущие версии
    • Релиз 30.09.21
    • Релиз 09.03.21
    • Релиз 26.02.21
    • Релиз 03.02.21
    • Релиз 14.12.20
    • Релиз 01.12.20
    • Релиз 24.11.20
    • Релиз 17.11.20
    • Релиз 26.10.20
    • Релиз 12.10.20
    • Релиз 18.08.20
    • Релиз 21.07.20
    • Релиз 27.05.20
    • Релиз 15.05.20
    • Релиз 16.04.20

Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.

Для распознавания

Подробное описание доступных версий находится в разделе Модели распознавания.

Для синтеза

В синтезе речи сервис предоставляет голоса двух типов: стандартные и премиум-голоса. В премиум-голосах используется новая технология синтеза.

Подробнее о голосовых моделях читайте в разделе О технологии.

Текущая версия

Информацию об обновлениях моделей синтеза см. на странице История изменений в сервисе синтеза Yandex SpeechKit.

Информацию об обновлениях моделей распознавания см. на странице История изменений в сервисе распознавания Yandex SpeechKit.

Предыдущие версии

Релиз 30.09.21

Крупное обновление премиум-голосов, доступных в REST API. Обновления голосов доступны под тегами alena:rc и filipp:rc.

Различные улучшения в качестве синтеза, в том числе в синтезе вопросительных фраз. Исправили редкую проблему с зацикливанием синтеза.

Для тестирования доступна функция — добавление акцентов на слова. Она позволит лучше контролировать интонацию, особенно при синтезе вопросительных фраз. Для выделения акцента после слова, которое необходимо выделить, добавьте <[accented]>. Например, Вы рады <[accented]> меня видеть? — акцент будет на слове рады.

Релиз 09.03.21

В потоковом распознавании, транскрибации и в распознавании коротких аудио по тегу general:rc доступна новая версия модели Демосфен. В ней улучшили базовое качество распознавания, распознавание медицинских специальностей и лексики, связанной с ювелирными изделиями.

Приглашаем к тестированию и будем благодарны за обратную связь!

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Амати.

В стриминге, транскрибации и распознавании коротких аудио:

  • general — версия Гален.
  • general:rc — версия Демосфен.
  • general:deprecated — версия Зенон.

Релиз 26.02.21

В транскрибации по тегу модели hqa доступна новая версия Гварнери. В ней заметно улучшено качество распознавания.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Гварнери.

В стриминге, транскрибации и распознавании коротких аудио:

  • general — версия Гален.
  • general:rc — версия Гален.
  • general:deprecated — версия Зенон.

Релиз 03.02.21

Версия Гален базовой модели распознавания успешно прошла тестирование и с 3 февраля становится основной версией модели распознавания.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Амати.

В стриминге, транскрибации и распознавании коротких аудио:

  • general— версия Гален.
  • general:rc — версия Гален.
  • general:deprecated — версия Зенон.

Релиз 14.12.20

В транскрибации по тегу модели hqa доступна новая версия Амати. В ней исправили случаи распознавания тишины вместо речи. Улучшили распознавание текстов из тематических доменов новостей и медицины.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Амати.

В стриминге, транскрибации и распознавании коротких аудио:

  • general— версия Зенон.
  • general:rc — версия Гален.
  • general:deprecated — версия Анаксимандр.

Релиз 01.12.20

В стриминге, транскрибации и в распознавании коротких аудио по тегу general:rc доступна новая версия модели Гален. В ней улучшили базовое качество распознавания, а также распознавание слов, связанных с Covid-19.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Страдивари.

В стриминге, транскрибации и распознавании коротких аудио:

  • general — версия Зенон.
  • general:rc — версия Гален.
  • general:deprecated — версия Анаксимандр.

Релиз 24.11.20

После успешного тестирования версия Зенон стала основной рабочей версией модели general в стриминге, транскрибации и распознавании коротких аудио.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Страдивари.

В стриминге, транскрибации и распознавании коротких аудио:

  • general и general:rc — версия Зенон.
  • general:deprecated — версия Анаксимандр.

Релиз 17.11.20

Внесли много исправлений в произношение отдельных слов за счет улучшенного механизма нормализации. Исправили склонение числительных. А по тегу alena доступна новая версия премиум-голоса alena.

Доступность версий по тегам

Без изменений.

Релиз 26.10.20

В транскрибации доступна модель распознавания нового поколения — hqa. У этой модели увеличенный словарный запас — результаты распознавания гораздо лучше, их легче воспринимать при чтении. Особенно этот эффект видно при распознавании длинных аудио.

Доступность версий по тегам

В транскрибации:

  • hqa — версия Страдивари.
  • general — версия Анаксимандр.
  • general:rc — версия Зенон.
  • general:deprecated — Марк Аврелий.

В стриминге и распознавании коротких аудио — без изменений.

Релиз 12.10.20

В новой версии существенно улучшили базовое качество распознавания. Новая версия модели general теперь доступна в стриминге, транскрибации, распознавании коротких аудио.

Доступность версий по тегам

  • general — версия Анаксимандр.
  • general:rc — версия Зенон.
  • general:deprecated — Марк Аврелий.

Релиз 18.08.20

Обновили версию Анаксимандр в транскрибации:

  • Улучшили работу с плотным потоком речи: когда в отрезках больше, чем 30 секунд, теперь нет заметных пауз.
  • Поправили работу тайминга.
  • Исправили ошибку с приходом частичных результатов распознавания уже после получения финального результата.

Акустические и языковые свойства модели остались прежними.

Доступность версий по тегам

Эти версии доступны для потокового распознавания, транскрибации и распознавания коротких аудио:

  • general — версия Анаксимандр.
  • general:rc — версия Анаксимандр (обновленная).
  • general:deprecated — версия Марк Аврелий.

Релиз 21.07.20

Теперь Анаксимандр — основная эксплуатируемая версия для потокового распознавания, транскрибации и распознавания коротких аудио.

Доступность версий по тегам

  • general и general:rc — версия Анаксимандр.
  • general:deprecated — версия Марк Аврелий.

Релиз 27.05.20

Новые версии модели general теперь доступны в транскрибации и в распознавании коротких аудио.

Доступность версий по тегам

Доступные версии по тегам:

  • general:rc — версия Анаксимандр.
  • general и general:deprecated — версия Марк Аврелий.

Доступные для потокового распознавания версии модели general:

  • general — версия Марк Аврелий.
  • general:rc — версия Анаксимандр.
  • general:deprecated — версия Диоген.

Релиз 15.05.20

Для потокового распознавания по тегу general:rc стала доступна новая версия модели Анаксимандр.

Доступность версий по тегам

  • general — версия Марк Аврелий.
  • general:rc — версия Анаксимандр.
  • general:deprecated — версия Диоген.

Версии для распознавания коротких и длинных аудио остались без изменений.

Релиз 16.04.20

Для потокового распознавания по тегу general стала доступна новая версия модели Марк Аврелий.

Доступность версий по тегам

  • general и general:rc — версия Марк Аврелий.
  • general:deprecated — версия Диоген.

Версии для распознавания коротких и длинных аудио, доступные по тегу general, остались без изменений.

Была ли статья полезна?

Предыдущая
Релизы синтеза
Следующая
Коды ошибок
Проект Яндекса
© 2025 ООО «Яндекс.Облако»