Как начать работать с Yandex SpeechSense
Сервис Yandex SpeechSense позволяет анализировать каналы коммуникации вашего бизнеса на основе записей разговоров или текстовых сообщений из чатов и интегрируется с вашими АТС и CRM-системами. SpeechSense использует голосовые технологии Yandex SpeechKit для расшифровки и статистического и качественного анализа аудиозаписей диалогов.
SpeechSense поддерживает анализ аудиозаписей и текстовых диалогов на русском языке.
Вы можете загрузить в SpeechSense свои данные или воспользоваться демонстрационным примером
Перед началом работы
- Перейдите в консоль управления
, затем войдите в Yandex Cloud или зарегистрируйтесь, если вы еще не зарегистрированы. О том, как начать работать с Yandex Cloud, см. в документе Начало работы с Yandex Cloud. - Примите пользовательское соглашение.
- В сервисе Yandex Cloud Billing
убедитесь, что у вас подключен платежный аккаунт и он находится в статусеACTIVE
илиTRIAL_ACTIVE
. Если платежного аккаунта нет, создайте его. - Убедитесь, что вашему аккаунту назначена роль
speech-sense.spaces.creator
. - Откройте главную страницу
SpeechSense. - Выберите организацию, в которой вы будете работать со SpeechSense, или создайте новую.
Настройте окружение
-
Создайте пространство, в котором будут находиться все ваши проекты: выберите Создать пространство, введите название, (опционально) добавьте описание и нажмите кнопку Создать.
-
К пространству привяжите платежный аккаунт, с которого будет оплачиваться использование SpeechSense.
Совет
Управлять платежным аккаунтом могут только пользователи с аккаунтом на Яндексе. Если вы работаете с Yandex Cloud через федерацию удостоверений, обратитесь
в техническую поддержку. -
Перейдите на вкладку Подключения и создайте подключение на основе метаинформации ваших аудиозаписей или переписок из чатов:
- Введите Название подключения.
- Выберите тип данных Двухканальное аудио или Чат.
- Задайте параметры подключения. Процесс подробно рассмотрен в разделе Создать подключение.
- Нажмите кнопку Создать подключение.
Пример metadata.json для загрузки аудиоданных
{ "direction_outgoung": "true", "client_id": "456", "client_name": "Павел Иванов", "date": "2023-09-29T09:08:38.958Z", "date_to": "2023-09-29T09:15:07.897Z", "language": "RU", "operator_id": "123", "operator_name": "Мария Федорова" }
-
Создайте проект: на странице пространства нажмите кнопку Создать проект, введите имя проекта, добавьте в проект подключение. Для каждого подключения вы можете выбрать правила фильтрации на основе метаинформации подключения и критериев YandexGPT API. Фильтры будут добавлять в проект только нужные диалоги. После добавления всех нужных подключений и настройки фильтров нажмите кнопку Создать проект.
Загрузите данные
Для загрузки данных в SpeechSense используется gRPC API.
Чтобы загрузить данные:
-
Добавьте сервисный аккаунт в пространство с ролью
speech-sense.data.editor
. Подробнее о ролях, действующих в сервисе, см. раздел Управление доступом в SpeechSense. -
Создайте API-ключ или IAM-токен для сервисного аккаунта, чтобы аутентифицироваться в API. Подробнее об аутентификации в API SpeechSense.
-
Загрузите аудиоданные или переписку из чата с помощью Python-скрипта отправки данных.
Аудио передается целиком в одном сообщении.
SpeechSense поддерживает следующие форматы аудиофайлов: