Как начать работать с Yandex SpeechSense

Статья создана

Обновлена 16 июля 2025 г.

Перед началом работы
Настройте окружение
Загрузите данные

Сервис Yandex SpeechSense позволяет анализировать каналы коммуникации вашего бизнеса на основе записей разговоров или текстовых сообщений из чатов и интегрируется с вашими АТС и CRM-системами. SpeechSense использует голосовые технологии Yandex SpeechKit для расшифровки и статистического и качественного анализа аудиозаписей диалогов.

SpeechSense поддерживает анализ аудиозаписей и текстовых диалогов на русском и казахском языках.

Вы можете загрузить в SpeechSense свои данные или воспользоваться демонстрационным примером, который был синтезирован с помощью SpeechKit.

Перед началом работы

Перейдите в консоль управления, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы. О том, как начать работать с Yandex Cloud, см. в документе Начало работы с Yandex Cloud.
Примите пользовательское соглашение.
В сервисе Yandex Cloud Billing убедитесь, что у вас подключен платежный аккаунт и он находится в статусе ACTIVE или TRIAL_ACTIVE. Если платежного аккаунта нет, создайте его.
Назначьте вашему аккаунту в Yandex Cloud роль speech-sense.spaces.creator.

Примечание

Если вы не можете управлять ролями, обратитесь к администратору вашего облака или организации.
Откройте главную страницу SpeechSense.
Выберите организацию, в которой вы будете работать со SpeechSense, или создайте новую.

Настройте окружение

Создайте пространство, в котором будут находиться все ваши проекты: выберите Создать пространство, введите название, (опционально) добавьте описание и нажмите кнопку Создать.
К пространству привяжите платежный аккаунт, с которого будет оплачиваться использование SpeechSense.

Примечание

Для управления платежным аккаунтом у пользователя должна быть назначена роль billing.accounts.editor, billing.accounts.admin или billing.accounts.owner на нужный платежный аккаунт.
Перейдите на вкладку Подключения и создайте подключение на основе метаинформации ваших аудиозаписей или переписок из чатов:
1. Введите Название подключения.
2. Выберите тип данных Двухканальное аудио, Одноканальное аудио или Чат.
3. Задайте параметры подключения. Процесс подробно рассмотрен в разделе Создать подключение.
4. Нажмите кнопку Создать подключение.
Пример metadata.json для загрузки аудиоданных
Даты указываются в формате ISO 8601 UTC с нулевым смещением времени. Если необходимо указать московское время, добавьте +03:00 вместо Z в конец строки: 2025-04-24T14:34:19+03:00.
```
{
   "direction_outgoung": "true",
   "client_id": "456",
   "client_name": "Павел Иванов",
   "date": "2023-09-29T09:08:38.958Z",
   "date_to": "2023-09-29T09:15:07.897Z",
   "language": "RU",
   "operator_id": "123",
   "operator_name": "Мария Федорова"
}
```
Создайте проект: на странице пространства нажмите кнопку Создать проект, введите имя проекта, добавьте в проект подключение. Для каждого подключения вы можете выбрать правила фильтрации на основе метаинформации подключения и критериев YandexGPT Pro. Фильтры будут добавлять в проект только нужные диалоги. После добавления всех нужных подключений и настройки фильтров нажмите кнопку Создать проект.

Загрузите данные

Для загрузки данных в SpeechSense используется gRPC API.

Чтобы загрузить данные:

Создайте сервисный аккаунт.
Добавьте сервисный аккаунт в пространство с ролью speech-sense.data.editor. Подробнее о ролях, действующих в сервисе, см. раздел Управление доступом в SpeechSense.
Создайте API-ключ или IAM-токен для сервисного аккаунта, чтобы аутентифицироваться в API. Подробнее об аутентификации в API SpeechSense.
Загрузите аудиоданные (без разбиения или с разбиением на отрезки) или переписку из чата с помощью Python-скрипта отправки данных.

Аудио передается целиком в одном сообщении.

SpeechSense поддерживает следующие форматы аудиофайлов:
- LPCM — AUDIO_ENCODING_LINEAR16_PCM
- WAV — CONTAINER_AUDIO_TYPE_WAV
- OggOpus — CONTAINER_AUDIO_TYPE_OGG_OPUS
- MP3 — CONTAINER_AUDIO_TYPE_MP3
Максимальная длительность аудио — 4 часа.

Как начать работать с Yandex SpeechSense

Перед началом работыПеред началом работы

Настройте окружениеНастройте окружение

Загрузите данныеЗагрузите данные

Была ли статья полезна?

Перед началом работы

Настройте окружение

Загрузите данные