Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
    • Обзор
    • Аутентификация в API
        • API синхронного распознавания
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации

В этой статье:

  • Query-параметры
  • Параметры в теле запроса
  • Ответ
  • Примеры использования
  1. Справочники API
  2. Распознавание
  3. API v1
  4. API синхронного распознавания

API синхронного распознавания

Статья создана
Yandex Cloud
Обновлена 21 января 2025 г.
  • Query-параметры
  • Параметры в теле запроса
  • Ответ
  • Примеры использования

С помощью API синхронного распознавания можно распознавать подготовленные аудиофайлы с такими характеристиками:

  • максимальный размер файла — 1 МБ;
  • максимальная длительность — 30 секунд;
  • максимальное количество аудиоканалов — 1.

Сервис синхронного распознавания располагается по адресу: stt.api.cloud.yandex.net/speech/v1/stt:recognize

Query-параметрыQuery-параметры

Параметр Описание
lang string
Язык, для которого будет выполнено распознавание.
Допустимые значения см. в описании модели. Значение по умолчанию — ru-RU  — русский язык.
topic string
Языковая модель, которую следует использовать при распознавании.
Чем точнее выбрана модель, тем лучше результат распознавания. В одном запросе можно указать только одну модель.
Допустимые значения зависят от выбранного языка. Значение параметра по умолчанию: general.
profanityFilter boolean
Параметр, регулирующий работу фильтра ненормативной лексики в распознанной речи.
Допустимые значения:
  • false (по умолчанию) — ненормативная лексика не будет исключена из результатов распознавания;
  • true — ненормативная лексика будет исключена из результатов распознавания.
rawResults boolean
Флаг, указывающий, как писать числа. true — писать прописью, false (по умолчанию) — писать цифрами.
format string
Формат передаваемого аудио.
Допустимые значения:
  • lpcm — LPCM без WAV-заголовка.
  • oggopus (по умолчанию) — OggOpus.
sampleRateHertz string
Частота дискретизации передаваемого аудио.
Применяется, если значение format равно lpcm. Допустимые значения:
  • 48000 (по умолчанию) — частота дискретизации 48 кГц;
  • 16000 — частота дискретизации 16 кГц;
  • 8000 — частота дискретизации 8 кГц.
folderId string

Идентификатор каталога, к которому у вас есть доступ. Требуется для авторизации с пользовательским аккаунтом (см. ресурс Аутентификация в API SpeechKit). Не используйте это поле, если вы делаете запрос от имени сервисного аккаунта.

Максимальная длина строки в символах — 50.

Параметры в теле запросаПараметры в теле запроса

В теле необходимо передать двоичное содержимое аудиофайла.

ОтветОтвет

Распознанный текст возвращается в ответе в поле result.

{
  "result": <распознанный_текст>
}

Подробнее о формате и кодах ответов см. на странице Коды ответов на запросы.

Примеры использованияПримеры использования

  • Пример использования API v1 синхронного распознавания.

Была ли статья полезна?

Предыдущая
Аутентификация в API
Следующая
API потокового распознавания
Проект Яндекса
© 2025 ООО «Яндекс.Облако»