Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ML Services
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
    • Обзор
    • Как распознать короткие аудиофайлы в API v1
    • Как распознать длинные аудиофайлы в API v3 и v2
    • Как синтезировать речь в API v1
    • Как синтезировать речь в API v3
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails

В этой статье:

  • Перед началом работы
  • Распознавание речи с помощью Playground
  • Синтез речи с помощью Playground
  • Распознавание речи через API
  • Синтез речи через API
  1. Начало работы
  2. Обзор

Начало работы со SpeechKit

Статья создана
Yandex Cloud
Обновлена 7 октября 2025 г.
  • Перед началом работы
  • Распознавание речи с помощью Playground
  • Синтез речи с помощью Playground
  • Распознавание речи через API
  • Синтез речи через API

Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо. О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.

Перед началом работыПеред началом работы

  1. Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы. О том, как начать работать с Yandex Cloud, см. в документе Начало работы с Yandex Cloud.
  2. Примите пользовательское соглашение.
  3. В сервисе Yandex Cloud Billing убедитесь, что у вас подключен платежный аккаунт и он находится в статусе ACTIVE или TRIAL_ACTIVE. Если платежного аккаунта нет, создайте его.

Распознавание речи с помощью PlaygroundРаспознавание речи с помощью Playground

Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground:

  1. В консоли управления выберите каталог, в котором вы будете работать с сервисом.
  2. В списке сервисов выберите SpeechKit.
  3. Перейдите на вкладку Распознавание речи.
  4. В поле Язык выберите нужный язык или оставьте значение Автоматически.
  5. Нажмите Выбрать файл или перетащите аудиофайл в зону загрузки.
  6. Нажмите кнопку Распознать, чтобы распознать речь в аудиофайле.

Подробную инструкцию см. на странице Распознавание речи с помощью Playground.

SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.

Синтез речи с помощью PlaygroundСинтез речи с помощью Playground

Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground:

  1. В консоли управления выберите каталог, в котором вы будете работать с сервисом.
  2. В списке сервисов выберите SpeechKit.
  3. Перейдите на вкладку Синтез речи.
  4. В блоке настроек в левой части окна:
    • Паузы — выберите длительность пауз между словами или задайте ее самостоятельно.
    • Акцент на слове — расставьте акценты на нужных словах.
    • Ударение — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.
    • Фонемы — контролируйте правильность произношения слов с помощью фонем.
  5. В блоке Настройки синтеза в правой части окна:
    • Язык — выберите язык диктора.
    • Голос — укажите голос диктора.
    • Амплуа — выберите амплуа диктора.
    • Скорость речи — задайте скорость речи диктора.
    • Высота голоса — скорректируйте высоту голоса диктора.
    • Формат аудио — выберите необходимый формат аудио.
  6. Нажмите кнопку Синтезировать и воспроизвести, чтобы синтезировать речь.
  7. Чтобы скачать результат, нажмите .

Подробную инструкцию см. на странице Синтез речи с помощью Playground.

SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.

Распознавание речи через APIРаспознавание речи через API

Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.

Синтез речи через APIСинтез речи через API

Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе Возможности синтеза.

См. такжеСм. также

  • Подробнее про распознавание речи
  • Подробнее про синтез речи
  • Поддерживаемые форматы аудио
  • Необходимые роли для выполнения операций
  • Все примеры интеграции SpeechKit

Была ли статья полезна?

Предыдущая
Обзор технологий SpeechKit
Следующая
Как распознать короткие аудиофайлы в API v1
Проект Яндекса
© 2025 ООО «Яндекс.Облако»