Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechSense
  • Начало работы
    • Аутентификация в API
      • Overview
        • Overview
        • UploadAsStream
        • Upload
        • UploadText
        • Search
        • Get
  • Аудитные логи Audit Trails
  • Управление доступом
  • Правила тарификации
  • История изменений
  • Вопросы и ответы

В этой статье:

  • gRPC request
  • UploadTalkRequest
  • TalkMetadata
  • UserMetadata
  • AudioRequest
  • AudioMetadata
  • RawAudio
  • ContainerAudio
  • AudioChunk
  • UploadTalkResponse
  1. Справочник API
  2. gRPC (англ.)
  3. Talk
  4. Upload

Talk Analytics API, gRPC: TalkService.Upload

Статья создана
Yandex Cloud
Обновлена 17 декабря 2024 г.
  • gRPC request
  • UploadTalkRequest
  • TalkMetadata
  • UserMetadata
  • AudioRequest
  • AudioMetadata
  • RawAudio
  • ContainerAudio
  • AudioChunk
  • UploadTalkResponse

rpc for uploading talk document as single message

gRPC requestgRPC request

rpc Upload (UploadTalkRequest) returns (UploadTalkResponse)

UploadTalkRequestUploadTalkRequest

{
  "talk_id": "string",
  "metadata": {
    "connection_id": "string",
    "fields": "map<string, string>",
    "users": [
      {
        "id": "string",
        "role": "UserRole",
        "fields": "map<string, string>"
      }
    ]
  },
  "audio": {
    "audio_metadata": {
      // Includes only one of the fields `raw_audio`, `container_audio`
      "raw_audio": {
        "audio_encoding": "AudioEncoding",
        "sample_rate_hertz": "int64",
        "audio_channel_count": "int64"
      },
      "container_audio": {
        "container_audio_type": "ContainerAudioType"
      }
      // end of the list of possible fields
    },
    "audio_data": {
      "data": "bytes"
    }
  }
}

request to create audio dialog

Field

Description

talk_id

string

talk_id, blank if initial upload request and present on metadata update

metadata

TalkMetadata

audio

AudioRequest

audio payload

TalkMetadataTalkMetadata

Field

Description

connection_id

string

id of connection this talk belongs too

fields

object (map<string, string>)

channel defined fields

users[]

UserMetadata

per user specific metadata

UserMetadataUserMetadata

Field

Description

id

string

role

enum UserRole

  • USER_ROLE_UNSPECIFIED
  • USER_ROLE_OPERATOR
  • USER_ROLE_CLIENT
  • USER_ROLE_BOT

fields

object (map<string, string>)

AudioRequestAudioRequest

request for sending small audios (< 128 mb) in one go

Field

Description

audio_metadata

AudioMetadata

audio metadata

audio_data

AudioChunk

Bytes with audio data.

AudioMetadataAudioMetadata

Audio format options.

Field

Description

raw_audio

RawAudio

Audio without container.

Includes only one of the fields raw_audio, container_audio.

container_audio

ContainerAudio

Audio is wrapped in container.

Includes only one of the fields raw_audio, container_audio.

RawAudioRawAudio

RAW Audio format spec (no container to infer type). Used in AudioFormat options.

Field

Description

audio_encoding

enum AudioEncoding

Type of audio encoding

  • AUDIO_ENCODING_UNSPECIFIED
  • AUDIO_ENCODING_LINEAR16_PCM: Audio bit depth 16-bit signed little-endian (Linear PCM).

sample_rate_hertz

int64

PCM sample rate

audio_channel_count

int64

PCM channel count.

ContainerAudioContainerAudio

Audio with fixed type in container. Used in AudioFormat options.

Field

Description

container_audio_type

enum ContainerAudioType

Type of audio container.

  • CONTAINER_AUDIO_TYPE_UNSPECIFIED
  • CONTAINER_AUDIO_TYPE_WAV: Audio bit depth 16-bit signed little-endian (Linear PCM).
  • CONTAINER_AUDIO_TYPE_OGG_OPUS: Data is encoded using the OPUS audio codec and compressed using the OGG container format.
  • CONTAINER_AUDIO_TYPE_MP3: Data is encoded using MPEG-1/2 Layer III and compressed using the MP3 container format.

AudioChunkAudioChunk

Data chunk with audio.

Field

Description

data

bytes

Bytes with audio data.

UploadTalkResponseUploadTalkResponse

{
  "talk_id": "string"
}

Field

Description

talk_id

string

id of created talk document

Была ли статья полезна?

Предыдущая
UploadAsStream
Следующая
UploadText
Проект Яндекса
© 2025 ООО «Яндекс.Облако»