Правила тарификации для SpeechKit
Чтобы рассчитать стоимость использования сервиса, воспользуйтесь калькулятором на сайте Yandex Cloud или ознакомьтесь с тарифами в этом разделе.
Цены на продукты сервиса также доступны в Прайс-листе.
Из чего складывается стоимость использования SpeechKit
Использование синтеза речи
Стоимость использования SpeechKit для синтеза речи зависит от версии используемого API.
API v1
Для API v1 стоимость рассчитывается исходя из суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).
API v3
Стоимость использования API v3 зависит от количества отправленных запросов на синтез. Стоимость рассчитывается за календарный месяц (Отчетный период).
По умолчанию запросы на синтез речи имеют ограничения — 250 символов и 24 секунды. Для синтеза более длинных фраз можно использовать режим unsafe_mode
. Тогда тарифицироваться будут каждые 250 символов, например:
- Запрос меньше 250 символов — одна единица тарификации.
- Запрос от 250 до 500 символов — две единицы тарификации.
- Запрос от 500 до 750 символов — три единицы тарификации.
Пустой запрос
Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса зависит от версии API:
- Пустой запрос к API v1 тарифицируется как один символ.
- Пустой запрос к API v3 тарифицируется как одна единица тарификации.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Использование распознавания речи
Стоимость использования SpeechKit для распознавания речи зависит от типа распознавания и длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).
Потоковый режим распознавания
Стоимость использования SpeechKit в режиме потокового распознавания рассчитывается по правилам тарификации синхронного распознавания.
Синхронное распознавание
Эти правила действуют при использовании синхронного распознавания и распознавания в потоковом режиме при использовании API v2 и API v3.
Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).
Важно
В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Если вы не отправляли аудио после этого сообщения, оно будет считаться как использованная единица тарификации.
Примеры^
1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.
Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.
2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.
Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.
Асинхронное распознавание
Эти правила действуют при использовании асинхронного распознавания.
Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.
Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.
Примеры с округлением длительности аудио:
Длительность | Количество каналов | Начислено секунд |
---|---|---|
1 секунда | 1 | 15 |
1 секунда | 2 | 15 |
1 секунда | 3 | 30 |
15.5 секунд | 2 | 16 |
15.5 секунд | 4 | 32 |
Пустой запрос
Пустой запрос к любому типу распознавания равен стоимости одной единицы тарификации.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Цены для региона Россия
Важно
Цены на ресурсы Yandex Cloud в разных регионах отличаются. Подробнее о доступных регионах см. Регионы.
Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.
Синтез речи
SpeechKit Brand Voice
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
Хостинг модели SpeechKit Brand Voice Self Service, за месяц | По запросу |
Хостинг модели SpeechKit Brand Voice Premium, за месяц | По запросу |
Запрос к модели SpeechKit Brand Voice Call Center | 0,16 ₽ |
Запрос к модели SpeechKit Brand Voice Self Service | 0,16 ₽ |
Запрос к модели SpeechKit Brand Voice Premium | 0,16 ₽ |
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
Хостинг модели SpeechKit Brand Voice Self Service, за месяц | По запросу |
Хостинг модели SpeechKit Brand Voice Premium, за месяц | По запросу |
Запрос к модели SpeechKit Brand Voice Call Center | 0,80 ₸ |
Запрос к модели SpeechKit Brand Voice Self Service | 0,80 ₸ |
Запрос к модели SpeechKit Brand Voice Premium | 0,80 ₸ |
Распознавание речи
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
Потоковое распознавание | 0,16 ₽ |
Синхронное распознавание файлов | 0,16 ₽ |
Асинхронное распознавание файлов | 0,01 ₽ |
Асинхронное распознавание файлов, отложенный режим | 0,0025 ₽ |
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
Потоковое распознавание | 0,80 ₸ |
Синхронное распознавание файлов | 0,80 ₸ |
Асинхронное распознавание файлов | 0,05 ₸ |
Асинхронное распознавание файлов, отложенный режим | 0,0125 ₸ |
Примеры расчета стоимости
Синтез речи с использованием API v1
Стоимость использования SpeechKit для синтеза речи с использованием API v1 со следующими параметрами:
- Количество символов, отправленных за месяц: 2023.
2023 × (1 320,00 ₽ / 1 000 000) = 2,67 ₽
Итого: 2,67 ₽.
Где:
- 1 320,00 ₽ — стоимость за 1 млн символов.
- 1 320,00 ₽ / 1 000 000 — стоимость за 1 символ.
2023 × (6 600,00 ₸ / 1 000 000) = 13,35 ₸
Итого: 13,35 ₸.
Где:
- 6 600,00 ₸ — стоимость за 1 млн символов.
- 6 600,00 ₸ / 1 000 000 — стоимость за 1 символ.
Синтез речи с использованием API v3
Стоимость использования SpeechKit для синтеза речи с использованием API v3 со следующими параметрами:
- Количество отправленных запросов: 3.
- Количество символов в запросах: 150, 300, 600.
(1 + 2 + 3) × 0,16 ₽ = 0,96 ₽
Итого: 0,96 ₽.
Где:
- 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
- 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима
unsafe_mode
. - 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима
unsafe_mode
. - 0,16 ₽ — стоимость единицы тарификации.
(1 + 2 + 3) × 0,80 ₸ = 4,80 ₸
Итого: 4,80 ₸.
Где:
- 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
- 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима
unsafe_mode
. - 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима
unsafe_mode
. - 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в потоковом режиме
Стоимость использования SpeechKit для распознавания речи в потоковом режиме со следующими параметрами:
- Количество аудиофрагментов: 2.
- Длительность аудиофрагментов: 5 секунд, 37 секунд.
( 1 + 3) × 0,16 ₽ = 0,64 ₽
Итого: 0,64 ₽.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,16 ₽ — стоимость единицы тарификации.
(1 + 3) × 0,80 ₸ = 3,20 ₸
Итого: 3,20 ₸.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд и учетом сообщения с настройками распознавания.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд и учетом сообщения с настройками распознавания.
- 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в синхронном режиме
Стоимость использования SpeechKit для распознавания речи в синхронном режиме со следующими параметрами:
- Количество аудиофрагментов: 2.
- Длительность аудиофрагментов: 5 секунд, 37 секунд.
(1 + 3) × 0,16 ₽ = 0,64 ₽
Итого: 0,64 ₽.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,16 ₽ — стоимость единицы тарификации.
(1 + 3) × 0,80 ₸ = 3,20 ₸
Итого: 3,20 ₸.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в асинхронном режиме
Стоимость использования SpeechKit для распознавания речи в асинхронном режиме со следующими параметрами:
- Количество аудиофрагментов: 4.
- Длительность аудиофрагментов: 5 секунд, 5 секунд, 15.5 секунд, 15.5 секунд.
- Количество каналов в аудиофрагментах: 1, 3, 2, 4.
(15 + 30 + 16 + 32) × 0,01 ₽ = 0,93 ₽
Итого: 0,93 ₽.
Где:
- 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
- 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 0,01 ₽ — стоимость единицы тарификации.
(15 + 30 + 16 + 32) × 0,06 ₸ = 5,58 ₸
Итого: 5,58 ₸.
Где:
- 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
- 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 0,06 ₸ — стоимость единицы тарификации.
Распознавание речи в асинхронном отложенном режиме
Стоимость использования SpeechKit для распознавания речи в асинхронном отложенном режиме со следующими параметрами:
- Количество аудиофрагментов: 3.
- Длительность аудиофрагментов: 2 секунды, 14 секунд, 19.5 секунд.
- Количество каналов в аудиофрагментах: 2, 3, 4.
(15 + 30 + 40) × 0,0025 ₽ = 0,21 ₽
Итого: 0,21 ₽.
Где:
- 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
- 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
- 0,0025 ₽ — стоимость единицы тарификации.
(15 + 30 + 40) × 0,0150 ₸ = 1,275 ₸
Итого: 1,275 ₸.
Где:
- 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
- 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
- 0,0150 ₸ — стоимость единицы тарификации.