Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechSense
  • Начало работы
    • Аутентификация в API
      • Overview
        • Overview
        • UploadAsStream
        • Upload
        • UploadText
        • Search
        • Get
  • Аудитные логи Audit Trails
  • Управление доступом
  • Правила тарификации
  • История изменений
  • Вопросы и ответы

В этой статье:

  • gRPC request
  • StreamTalkRequest
  • TalkMetadata
  • UserMetadata
  • AudioStreamingRequest
  • AudioMetadata
  • RawAudio
  • ContainerAudio
  • AudioChunk
  • UploadTalkResponse
  1. Справочник API
  2. gRPC (англ.)
  3. Talk
  4. UploadAsStream

Talk Analytics API, gRPC: TalkService.UploadAsStream

Статья создана
Yandex Cloud
Обновлена 17 декабря 2024 г.
  • gRPC request
  • StreamTalkRequest
  • TalkMetadata
  • UserMetadata
  • AudioStreamingRequest
  • AudioMetadata
  • RawAudio
  • ContainerAudio
  • AudioChunk
  • UploadTalkResponse

rpc for streaming talk documents. First message should contain Talk related metadata,
second - audio metadata, others should contain audio bytes in chunks

gRPC requestgRPC request

rpc UploadAsStream (stream StreamTalkRequest) returns (UploadTalkResponse)

StreamTalkRequestStreamTalkRequest

{
  // Includes only one of the fields `metadata`, `audio`
  "metadata": {
    "connection_id": "string",
    "fields": "map<string, string>",
    "users": [
      {
        "id": "string",
        "role": "UserRole",
        "fields": "map<string, string>"
      }
    ]
  },
  "audio": {
    // Includes only one of the fields `audio_metadata`, `chunk`
    "audio_metadata": {
      // Includes only one of the fields `raw_audio`, `container_audio`
      "raw_audio": {
        "audio_encoding": "AudioEncoding",
        "sample_rate_hertz": "int64",
        "audio_channel_count": "int64"
      },
      "container_audio": {
        "container_audio_type": "ContainerAudioType"
      }
      // end of the list of possible fields
    },
    "chunk": {
      "data": "bytes"
    }
    // end of the list of possible fields
  }
  // end of the list of possible fields
}

streaming request to create audio dialog

Field

Description

metadata

TalkMetadata

talk document metadata containing channel id and channel field values

Includes only one of the fields metadata, audio.

audio

AudioStreamingRequest

audio metadata or chunk

Includes only one of the fields metadata, audio.

TalkMetadataTalkMetadata

Field

Description

connection_id

string

id of connection this talk belongs too

fields

object (map<string, string>)

channel defined fields

users[]

UserMetadata

per user specific metadata

UserMetadataUserMetadata

Field

Description

id

string

role

enum UserRole

  • USER_ROLE_UNSPECIFIED
  • USER_ROLE_OPERATOR
  • USER_ROLE_CLIENT
  • USER_ROLE_BOT

fields

object (map<string, string>)

AudioStreamingRequestAudioStreamingRequest

Streaming audio request
First message should be audio metadata.
The next messages are audio data chunks.

Field

Description

audio_metadata

AudioMetadata

Session options. Should be the first message from user.

Includes only one of the fields audio_metadata, chunk.

chunk

AudioChunk

Chunk with audio data.

Includes only one of the fields audio_metadata, chunk.

AudioMetadataAudioMetadata

Audio format options.

Field

Description

raw_audio

RawAudio

Audio without container.

Includes only one of the fields raw_audio, container_audio.

container_audio

ContainerAudio

Audio is wrapped in container.

Includes only one of the fields raw_audio, container_audio.

RawAudioRawAudio

RAW Audio format spec (no container to infer type). Used in AudioFormat options.

Field

Description

audio_encoding

enum AudioEncoding

Type of audio encoding

  • AUDIO_ENCODING_UNSPECIFIED
  • AUDIO_ENCODING_LINEAR16_PCM: Audio bit depth 16-bit signed little-endian (Linear PCM).

sample_rate_hertz

int64

PCM sample rate

audio_channel_count

int64

PCM channel count.

ContainerAudioContainerAudio

Audio with fixed type in container. Used in AudioFormat options.

Field

Description

container_audio_type

enum ContainerAudioType

Type of audio container.

  • CONTAINER_AUDIO_TYPE_UNSPECIFIED
  • CONTAINER_AUDIO_TYPE_WAV: Audio bit depth 16-bit signed little-endian (Linear PCM).
  • CONTAINER_AUDIO_TYPE_OGG_OPUS: Data is encoded using the OPUS audio codec and compressed using the OGG container format.
  • CONTAINER_AUDIO_TYPE_MP3: Data is encoded using MPEG-1/2 Layer III and compressed using the MP3 container format.

AudioChunkAudioChunk

Data chunk with audio.

Field

Description

data

bytes

Bytes with audio data.

UploadTalkResponseUploadTalkResponse

{
  "talk_id": "string"
}

Field

Description

talk_id

string

id of created talk document

Была ли статья полезна?

Предыдущая
Overview
Следующая
Upload
Проект Яндекса
© 2025 ООО «Яндекс.Облако»