Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
    • Распознавание речи с помощью Playground
    • Синтез речи с помощью Playground
      • Синтез речи в API v3
      • Синтез речи в REST API v3
      • Синтез речи по шаблонам
      • Синтез речи по шаблонам Brand Voice Call Center
      • Синтез речи в формате WAV — API v1
      • Синтез речи в формате OggOpus — API v1
      • Синтез речи из текста SSML — API v1
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  1. Пошаговые инструкции
  2. Синтез
  3. Синтез речи в REST API v3

Синтез речи в API v3 REST

Статья создана
Yandex Cloud
Обновлена 27 марта 2025 г.

SpeechKit REST API v3 можно использовать для синтеза речи, если вам не нужны преимущества gRPC API.

В примере заданы следующие параметры синтеза:

  • голос — marina
  • амплуа — friendly (дружелюбная)
  • формат аудио — WAV (значение по умолчанию)

Аутентификация происходит от имени аккаунта на Яндексе или федеративного аккаунта с использованием IAM-токена. Для аутентификации необходим идентификатор каталога, в котором у пользователя есть роль ai.speechkit-tts.user для работы с сервисом SpeechKit. Если вы используете сервисный аккаунт, передавать в запросе идентификатор каталога не нужно. Подробнее об аутентификации в API SpeechKit см. Аутентификация в API SpeechKit.

cURL

Чтобы повторить пример, потребуется утилита jq для работы с файлами JSON.

  1. Создайте файл request.json с параметрами запроса:

    {"text": "Привет! Я Яндекс Спичк+ит. Я могу превратить любой текст в речь. Теперь и в+ы - можете!", "hints": [{"voice": "marina"}, {"role": "friendly"}]}
    

    Где:

    • text — синтезируемый текст;
    • hints — список параметров синтеза:
      • voice — голос для синтеза
      • role — амплуа
  2. В терминале выполните запрос, указав IAM-токен и идентификатор каталога, который вы будете использовать для работы с SpeechKit:

    export FOLDER_ID=<идентификатор_каталога>
    export IAM_TOKEN=<IAM-токен>
    
    curl \
      --header "Authorization: Bearer $IAM_TOKEN" \
      --header "x-folder-id: $FOLDER_ID" \
      --data @request.json https://tts.api.cloud.yandex.net:443/tts/v3/utteranceSynthesis | \
      jq -r  '.result.audioChunk.data' | \
      while read chunk; do base64 -d <<< "$chunk" >> audio.wav; done
    

    Где:

    • FOLDER_ID— идентификатор каталога, на который у вашего аккаунта есть роль ai.speechkit-tts.user или выше. Если вы используете сервисный аккаунт, передавать в запросе идентификатор каталога не нужно.
    • IAM_TOKEN — IAM-токен вашего аккаунта на Яндексе или федеративного аккаунта.

    Синтезированная речь вернется в кодировке Base64 и будет записана в файл audio.wav.

Была ли статья полезна?

Предыдущая
Синтез речи в API v3
Следующая
Синтез речи по шаблонам
Проект Яндекса
© 2025 ООО «Яндекс.Облако»