Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
    • Распознавание речи с помощью Playground
    • Синтез речи с помощью Playground
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails
  1. Пошаговые инструкции
  2. Распознавание речи с помощью Playground

Распознавание речи с помощью Playground

Статья создана
Yandex Cloud
Обновлена 26 ноября 2025 г.

Чтобы распознать речь из аудиофайла через SpeechKit Playground:

Консоль управления
  1. В консоли управления выберите каталог, в котором вы будете работать с сервисом.

  2. Перейдите в сервис SpeechKit.

  3. На панели слева выберите SpeechKit Playground.

  4. Перейдите на вкладку Распознавание речи.

  5. В блоке Параметры распознавания:

    • Язык — выберите нужный язык или оставьте значение Автоматически.
    • Нормализация текста — представляет даты и время в цифровом формате, преобразовывает числа из словарного в цифровой формат и открывает доступ к дополнительным настройкам.
    • Фильтрация обсценной лексики — маскирует обсценную лексику.
    • Литературный текст — добавляет заглавные буквы и знаки пунктуации.
    • Определение дикторов — размечает, какому из дикторов принадлежит каждая распознанная фраза.
    • Группировка фраз дикторов — разделяет фразы на две группы по дикторам.
  6. Нажмите Выбрать файл или перетащите аудиофайл в зону загрузки.

    Совет

    Заранее конвертируйте файл в поддерживаемый аудиоформат: MP3, WAV или OGG с аудиокодеком OPUS. Максимальный размер файла — 60 МБ.

  7. Классификаторы — находит в тексте фразы заданной категории, например, приветствие, негатив или мат. Работает только для русского языка.

  8. Обработка результатов — обработка результатов с помощью LLM:

    • Модель — выберите модель для обработки. Стоимость обработки зависит от выбранной модели.
    • Инструкция:
      • Напишите промпт в поле ввода или выберите готовый.
      • Формат результата — укажите предпочитаемый формат для результатов распознавания.
      • Добавить инструкцию — добавьте еще одну инструкцию. Всего можно добавить до пяти инструкций.
  9. Нажмите Распознать, чтобы распознать речь в аудиофайле.

    Распознавание может занять от нескольких секунд до нескольких минут в зависимости от размера аудиофайла.

  10. Нажмите Посмотреть код, чтобы получить код запроса для Python REST или Python gRPC.

screen

SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.

Была ли статья полезна?

Предыдущая
Как синтезировать речь в API v3
Следующая
Синтез речи с помощью Playground
Проект Яндекса
© 2025 ООО «Яндекс.Облако»