NewРаспознавание речи из аудио-видео в текст(транскрибация)Здравствуйте. Как и предложила ваша служба поддержки пишу свой запрос. Мол если наберётся много желающих, реализуете. Ставьте лайки все, кому это нужно и все кому не нужно. Сделаете мне приятно. Надеюсь это нужно не только мне. Постоянно требуется (транскрибировать) распознавать...
NewSDK для ML-сервисов (Python, PHP, etc..)Для более удобной работы/тестирования ML-сервисов Яндекс.Облака сейчас не хватает SDK, и приходится использовать такие утилиты как curl и т.д. Это не всегда удобно и может приводить к определенным сложностям.
NewФорматы аудио для SpeechKitПредлагаю добавить распознавание аудио самых популярных форматов: mp3 и wav. Сейчас, если есть желание распознавать текст записей телефонных звонков, сначала приходится делать конвертацию в .ogg и только потом распознавать, т.к. многие ip-телефонии не дают выгружать записи сразу...
NewДеление на спикеровНужно деление на спикеров, по аналогии с апи гугла и амазона https://cloud.google.com/speech-to-text/docs/multiple-voices
NewРасшифровка диктофонных записей с учётом тембров голосов собеседниковНужна расшифровка диктофонных записей переговоров. Обычно, такие диктофонные записи делаются сохраняются в одной моно дорожке. Уже сейчас сервис голосового помощника «Алиса» умеет распознавать голос говорящего по его тембральной окраске для авторизации на Яндекс...
NewУдарные гласные в синтезаторе речиВключите, пожалуйста распознавание букв с ударениями а́, е́, и́, о́, у́, э́, ы́, ю́, я́. Я уже переименовал остановки общественного транспорта в сервисе bustime.ru, чтобы почти идеально работал автоинформатор в программе этого сервиса с использованием драйвера синтеза речи...
NewДобавить методы передачи длинного аудио-файла в SpeechKit1. Указав прямую https ссылку на файл на любом хостинге. 2. Отправкой post, или как это сделано у google: client = speech_v1p1beta1.SpeechClient() with io.open(file_path, 'rb') as audio_file: content = audio_file.read() audio =...
NewБольше языков в SpeechKitБыло бы не плохо добавить более использованных языков для синтеза речи. В SpeechKit добавлен турецкий язык. Его используют меньше, чем немецкий, итальянский или французский. Живу в Германии и мне нужен немецкий язык.