Правила тарификации для SpeechKit
Совет
Чтобы рассчитать стоимость синтеза и распознавания речи, воспользуйтесь калькулятором на сайте Yandex Cloud или ознакомьтесь с тарифами в этом разделе.
Цены на продукты сервиса также доступны в Прайс-листе.
Из чего складывается стоимость использования SpeechKit
Использование синтеза речи
Стоимость использования SpeechKit для синтеза речи зависит от версии используемого API.
API v1
Для API v1 стоимость рассчитывается исходя из суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).
API v3
Стоимость использования API v3 зависит от количества отправленных запросов на синтез. Стоимость рассчитывается за календарный месяц (Отчетный период).
По умолчанию запросы на синтез речи имеют ограничения — 250 символов и 24 секунды. Для синтеза более длинных фраз можно использовать режим unsafe_mode
. Тогда тарифицироваться будут каждые 250 символов, например:
- Запрос меньше 250 символов — одна единица тарификации.
- Запрос от 250 до 500 символов — две единицы тарификации.
- Запрос от 500 до 750 символов — три единицы тарификации.
Пустой запрос
Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса зависит от версии API:
- Пустой запрос к API v1 тарифицируется как один символ.
- Пустой запрос к API v3 тарифицируется как одна единица тарификации.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Использование распознавания речи
Стоимость использования SpeechKit для распознавания речи зависит от типа распознавания и длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).
Потоковый режим распознавания
Стоимость использования SpeechKit в режиме потокового распознавания рассчитывается по правилам тарификации синхронного распознавания.
Синхронное распознавание
Эти правила действуют при использовании синхронного распознавания и распознавания в потоковом режиме при использовании API v2 и API v3.
Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).
Важно
В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Если вы не отправляли аудио после этого сообщения, оно будет считаться как использованная единица тарификации.
Примеры^
1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.
Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.
2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.
Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.
Асинхронное распознавание
Эти правила действуют при использовании асинхронного распознавания.
Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.
Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.
Примеры с округлением длительности аудио:
Длительность | Количество каналов | Начислено секунд |
---|---|---|
1 секунда | 1 | 15 |
1 секунда | 2 | 15 |
1 секунда | 3 | 30 |
15.5 секунд | 2 | 16 |
15.5 секунд | 4 | 32 |
Пустой запрос
Пустой запрос к любому типу распознавания равен стоимости одной единицы тарификации.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Цены для региона Россия
Примечание
Цены на ресурсы Yandex Cloud в разных регионах отличаются. Подробнее о доступных регионах см. Регионы.
Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.
Синтез речи
SpeechKit Brand Voice
Примечание
Цены на хостинг моделей SpeechKit Brand Voice Lite начнут действовать с 2 июля 2025 года.
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
SpeechKit Brand Voice Call Center | |
Запрос | 0,16 ₽ |
SpeechKit Brand Voice Self Service | |
Хостинг, за месяц | 240 000 ₽ |
Запрос | 0,16 ₽ |
SpeechKit Brand Voice Lite | |
Разовый платеж за создание одного голоса | 9 000 ₽ |
Хостинг, первые семь дней 1 | Не тарифицируется |
Хостинг, один голос, за месяц | 100 000 ₽ |
Хостинг, второй голос, за месяц | 90 000 ₽ |
Хостинг, третий голос, за месяц | 80 000 ₽ |
Хостинг, четвертый голос, за месяц | 70 000 ₽ |
Хостинг, пятый голос, за месяц | 60 000 ₽ |
Хостинг, шестой и последующие голоса, за месяц | 50 000 ₽ |
Запрос | 0,16 ₽ |
SpeechKit Brand Voice Premium | |
Хостинг, за месяц | По запросу |
Запрос | 0,16 ₽ |
1 Хостинг модели Brand Voice Lite не тарифицируется первые семь дней после создания голоса, чтобы пользователь мог её протестировать, оценить эффективность и согласовать результаты. Далее оплата производится по указанному тарифу.
Услуга | Цена за единицу тарификации, вкл. НДС |
---|---|
SpeechKit Brand Voice Call Center | |
Запрос | 0,80 ₸ |
SpeechKit Brand Voice Self Service | |
Хостинг, за месяц | 1 200 000 ₸ |
Запрос | 0,80 ₸ |
SpeechKit Brand Voice Lite | |
Разовый платеж за создание одного голоса | 45 000 ₸ |
Хостинг, первые семь дней 1 | Не тарифицируется |
Хостинг, один голос, за месяц | 500 000 ₸ |
Хостинг, второй голос, за месяц | 450 000 ₸ |
Хостинг, третий голос, за месяц | 400 000 ₸ |
Хостинг, четвертый голос, за месяц | 350 000 ₸ |
Хостинг, пятый голос, за месяц | 300 000 ₸ |
Хостинг, шестой и последующие голоса, за месяц | 250 000 ₸ |
Запрос | 0,80 ₸ |
SpeechKit Brand Voice Premium | |
Хостинг, за месяц | По запросу |
Запрос | 0,80 ₸ |
1 Хостинг модели Brand Voice Lite не тарифицируется первые семь дней после создания голоса, чтобы пользователь мог её протестировать, оценить эффективность и согласовать результаты. Далее оплата производится по указанному тарифу.
Распознавание речи
Услуга | Цена за 15 секунд аудио, вкл. НДС |
---|---|
Потоковое распознавание | 0,16 ₽ |
Синхронное распознавание файлов | 0,16 ₽ |
Асинхронное распознавание файлов* | 0,15 ₽ |
Асинхронное распознавание файлов, отложенный режим* | 0,0375 ₽ |
* Посекундная тарификация с 16 секунды.
Услуга | Цена за 15 секунд аудио, вкл. НДС |
---|---|
Потоковое распознавание | 0,80 ₸ |
Синхронное распознавание файлов | 0,80 ₸ |
Асинхронное распознавание файлов* | 0,75 ₸ |
Асинхронное распознавание файлов, отложенный режим* | 0,1875 ₸ |
* Посекундная тарификация с 16 секунды.
Примеры расчета стоимости
Синтез речи с использованием API v1
Стоимость использования SpeechKit для синтеза речи с использованием API v1 со следующими параметрами:
- Количество символов, отправленных за месяц: 2023.
2023 × (1 320,00 ₽ / 1 000 000) = 2,67 ₽
Итого: 2,67 ₽.
Где:
- 1 320,00 ₽ — стоимость за 1 млн символов.
- 1 320,00 ₽ / 1 000 000 — стоимость за 1 символ.
2023 × (6 600,00 ₸ / 1 000 000) = 13,35 ₸
Итого: 13,35 ₸.
Где:
- 6 600,00 ₸ — стоимость за 1 млн символов.
- 6 600,00 ₸ / 1 000 000 — стоимость за 1 символ.
Синтез речи с использованием API v3
Стоимость использования SpeechKit для синтеза речи с использованием API v3 со следующими параметрами:
- Количество отправленных запросов: 3.
- Количество символов в запросах: 150, 300, 600.
(1 + 2 + 3) × 0,16 ₽ = 0,96 ₽
Итого: 0,96 ₽.
Где:
- 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
- 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима
unsafe_mode
. - 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима
unsafe_mode
. - 0,16 ₽ — стоимость единицы тарификации.
(1 + 2 + 3) × 0,80 ₸ = 4,80 ₸
Итого: 4,80 ₸.
Где:
- 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
- 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима
unsafe_mode
. - 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима
unsafe_mode
. - 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в потоковом режиме
Стоимость использования SpeechKit для распознавания речи в потоковом режиме со следующими параметрами:
- Количество аудиофрагментов: 2.
- Длительность аудиофрагментов: 5 секунд, 37 секунд.
(1 + 3) × 0,16 ₽ = 0,64 ₽
Итого: 0,64 ₽.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,16 ₽ — стоимость единицы тарификации.
(1 + 3) × 0,80 ₸ = 3,20 ₸
Итого: 3,20 ₸.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд и учетом сообщения с настройками распознавания.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд и учетом сообщения с настройками распознавания.
- 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в синхронном режиме
Стоимость использования SpeechKit для распознавания речи в синхронном режиме со следующими параметрами:
- Количество аудиофрагментов: 2.
- Длительность аудиофрагментов: 5 секунд, 37 секунд.
(1 + 3) × 0,16 ₽ = 0,64 ₽
Итого: 0,64 ₽.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,16 ₽ — стоимость единицы тарификации.
(1 + 3) × 0,80 ₸ = 3,20 ₸
Итого: 3,20 ₸.
Где:
- 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
- 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
- 0,80 ₸ — стоимость единицы тарификации.
Распознавание речи в асинхронном режиме
Стоимость использования SpeechKit для распознавания речи в асинхронном режиме со следующими параметрами:
- Количество аудиофрагментов: 4.
- Длительность аудиофрагментов: 5 секунд, 5 секунд, 15.5 секунд, 15.5 секунд.
- Количество каналов в аудиофрагментах: 1, 3, 2, 4.
(15 + 30 + 16 + 32) × 0,01 ₽ = 0,93 ₽
Итого: 0,93 ₽.
Где:
- 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
- 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 0,01 ₽ — стоимость единицы тарификации.
(15 + 30 + 16 + 32) × 0,05 ₸ = 4,65 ₸
Итого: 4,65 ₸.
Где:
- 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
- 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
- 0,05 ₸ — стоимость единицы тарификации.
Распознавание речи в асинхронном отложенном режиме
Стоимость использования SpeechKit для распознавания речи в асинхронном отложенном режиме со следующими параметрами:
- Количество аудиофрагментов: 3.
- Длительность аудиофрагментов: 2 секунды, 14 секунд, 19.5 секунд.
- Количество каналов в аудиофрагментах: 2, 3, 4.
(15 + 30 + 40) × 0,0025 ₽ = 0,21 ₽
Итого: 0,21 ₽.
Где:
- 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
- 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
- 0,0025 ₽ — стоимость единицы тарификации.
(15 + 30 + 40) × 0,0125 ₸ = 1,06 ₸
Итого: 1,06 ₸.
Где:
- 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
- 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
- 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
- 0,0125 ₸ — стоимость единицы тарификации.