Правила тарификации для SpeechKit

Статья создана

Обновлена 28 января 2026 г.

Из чего складывается стоимость использования SpeechKit
- Использование синтеза речи
- Использование распознавания речи
Цены для региона Россия
Примеры расчета стоимости

Совет

Чтобы рассчитать стоимость синтеза и распознавания речи, воспользуйтесь калькулятором на сайте Yandex Cloud или ознакомьтесь с тарифами в этом разделе.

Цены на продукты сервиса также доступны в Прайс-листе.

Все цены в рублях и тенге указаны с НДС, все цены в долларах — без НДС.

Из чего складывается стоимость использования SpeechKit

Использование синтеза речи

Стоимость использования SpeechKit для синтеза речи зависит от версии используемого API.

API v1

Для API v1 стоимость рассчитывается исходя из суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).

API v3

Стоимость использования API v3 зависит от количества отправленных запросов на синтез. Стоимость рассчитывается за календарный месяц (Отчетный период).

По умолчанию запросы на синтез речи имеют ограничения — 250 символов и 24 секунды. Для синтеза более длинных фраз можно использовать unsafe_mode или потоковый режим. Тогда тарифицироваться будут каждые 250 символов, например:

Запрос меньше 250 символов — одна единица тарификации.
Запрос от 250 до 500 символов — две единицы тарификации.
Запрос от 500 до 750 символов — три единицы тарификации.

Пустой запрос

Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса зависит от версии API:

Пустой запрос к API v1 тарифицируется как один символ.
Пустой запрос к API v3 тарифицируется как одна единица тарификации.

Внутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Использование распознавания речи

Стоимость использования SpeechKit для распознавания речи зависит от типа распознавания и длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).

Потоковый режим распознавания

Стоимость использования SpeechKit в режиме потокового распознавания рассчитывается по правилам тарификации синхронного распознавания.

Синхронное распознавание

Эти правила действуют при использовании синхронного распознавания и распознавания в потоковом режиме при использовании API v2 и API v3.

Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).

Важно

В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Если вы не отправляли аудио после этого сообщения, оно будет считаться как использованная единица тарификации.

Примеры:

1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.

Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.

2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.

Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.

Асинхронное распознавание

Эти правила действуют при использовании асинхронного распознавания.

Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.

Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.

Примеры с округлением длительности аудио:

Длительность	Количество каналов	Начислено секунд
1 секунда	1	15
1 секунда	2	15
1 секунда	3	30
15.5 секунд	2	16
15.5 секунд	4	32

Пустой запрос

Пустой запрос к любому типу распознавания равен стоимости одной единицы тарификации.

Внутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Цены для региона Россия

Примечание

Цены на ресурсы Yandex Cloud в разных регионах различаются. Подробнее о доступных регионах см. Регионы.

Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.

Синтез речи

Цены в рублях

Цены в тенге

Услуга	Цена за единицу тарификации, вкл. НДС
Синтез с использованием API v1, за 1 млн символов	1 342,00 ₽
Синтез с использованием API v3, за запрос	0,1627 ₽

Услуга	Цена за единицу тарификации, вкл. НДС
Синтез с использованием API v1, за 1 млн символов	6 835,71 ₸
Синтез с использованием API v3, за запрос	0,83 ₸

SpeechKit Brand Voice

Цены в рублях

Цены в тенге

Услуга	Цена за единицу тарификации, вкл. НДС
SpeechKit Brand Voice Call Center
Запрос	0,1627 ₽
SpeechKit Brand Voice Lite
Разовый платеж за создание одного голоса	9 150,00 ₽
Хостинг, первые семь дней ¹	Не тарифицируется
Хостинг, один голос, за месяц	101 666,67 ₽
Хостинг, второй голос, за месяц	91 500,00 ₽
Хостинг, третий голос, за месяц	81 333,33 ₽
Хостинг, четвертый голос, за месяц	71 166,67 ₽
Хостинг, пятый голос, за месяц	61 000,00 ₽
Хостинг, шестой и последующие голоса, за месяц	50 833,33 ₽
Запрос	0,16 ₽
SpeechKit Brand Voice Premium
Хостинг, за месяц	По запросу
Запрос	0,1627 ₽

¹ Хостинг модели Brand Voice Lite не тарифицируется первые семь дней после создания голоса, чтобы пользователь мог ее протестировать, оценить эффективность и согласовать результаты. Далее оплата производится по указанному тарифу.

Услуга	Цена за единицу тарификации, вкл. НДС
SpeechKit Brand Voice Call Center
Запрос	0,83 ₸
SpeechKit Brand Voice Lite
Разовый платеж за создание одного голоса	46 607,14 ₸
Хостинг, первые семь дней ¹	Не тарифицируется
Хостинг, один голос, за месяц	517 857,14 ₸
Хостинг, второй голос, за месяц	466 071,43 ₸
Хостинг, третий голос, за месяц	414 285,71 ₸
Хостинг, четвертый голос, за месяц	362 500,00 ₸
Хостинг, пятый голос, за месяц	310 714,29 ₸
Хостинг, шестой и последующие голоса, за месяц	258 928,57 ₸
Запрос	0,83 ₸
SpeechKit Brand Voice Premium
Хостинг, за месяц	По запросу
Запрос	0,83 ₸

¹ Хостинг модели Brand Voice Lite в статусе Trial не тарифицируется первые семь дней после создания голоса, чтобы пользователь мог ее протестировать, оценить эффективность и согласовать результаты. Далее оплата производится по указанному тарифу.

Распознавание речи

Цены в рублях

Цены в тенге

Услуга	Цена за 15 секунд аудио, вкл. НДС
Потоковое распознавание	0,1627 ₽
Синхронное распознавание файлов	0,1627 ₽
Асинхронное распознавание файлов^*	0,1530 ₽
Асинхронное распознавание файлов, отложенный режим^*	0,0381 ₽

^* Посекундная тарификация с 16 секунды.

Услуга	Цена за 15 секунд аудио, вкл. НДС
Потоковое распознавание	0,83 ₸
Синхронное распознавание файлов	0,83 ₸
Асинхронное распознавание файлов^*	0,78 ₸
Асинхронное распознавание файлов, отложенный режим^*	0,1935 ₸

^* Посекундная тарификация с 16 секунды.

Примеры расчета стоимости

Синтез речи с использованием API v1

Стоимость использования SpeechKit для синтеза речи с использованием API v1 со следующими параметрами:

Количество символов, отправленных за месяц: 2023.

Расчет в рублях

Расчет в тенге

2023 × (1 342,00 ₽ / 1 000 000) = 2,71 ₽

Итого: 2,71 ₽.

Где:

1 342,00 ₽ — стоимость за 1 млн символов.
1 342,00 ₽ / 1 000 000 — стоимость за 1 символ.

2023 × (6 835,71 ₸ / 1 000 000) = 13,83 ₸

Итого: 13,83 ₸.

Где:

6 835,71 ₸ — стоимость за 1 млн символов.
6 835,71 ₸ / 1 000 000 — стоимость за 1 символ.

Синтез речи с использованием API v3

Стоимость использования SpeechKit для синтеза речи с использованием API v3 со следующими параметрами:

Количество отправленных запросов: 3.
Количество символов в запросах: 150, 300, 600.

Расчет в рублях

Расчет в тенге

(1 + 2 + 3) × 0,1627 ₽ = 0,98 ₽

Итого: 0,98 ₽.

Где:

1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима unsafe_mode.
3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима unsafe_mode.
0,1627 ₽ — стоимость единицы тарификации.

(1 + 2 + 3) × 0,83 ₸ = 4,98 ₸

Итого: 4,98 ₸.

Где:

1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима unsafe_mode.
3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима unsafe_mode.
0,83 ₸ — стоимость единицы тарификации.

Распознавание речи в потоковом режиме

Стоимость использования SpeechKit для распознавания речи в потоковом режиме со следующими параметрами:

Количество аудиофрагментов: 2.
Длительность аудиофрагментов: 5 секунд, 37 секунд.

Расчет в рублях

Расчет в тенге

(1 + 3) × 0,1627 ₽ = 0,65 ₽

Итого: 0,65 ₽.

Где:

1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
0,1627 ₽ — стоимость единицы тарификации.

(1 + 3) × 0,83 ₸ = 3,32 ₸

Итого: 3,32 ₸.

Где:

1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд и учетом сообщения с настройками распознавания.
3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд и учетом сообщения с настройками распознавания.
0,83 ₸ — стоимость единицы тарификации.

Распознавание речи в синхронном режиме

Стоимость использования SpeechKit для распознавания речи в синхронном режиме со следующими параметрами:

Количество аудиофрагментов: 2.
Длительность аудиофрагментов: 5 секунд, 37 секунд.

Расчет в рублях

Расчет в тенге

(1 + 3) × 0,1627 ₽ = 0,65 ₽

Итого: 0,65 ₽.

Где:

1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
0,1627 ₽ — стоимость единицы тарификации.

(1 + 3) × 0,83 ₸ = 3,32 ₸

Итого: 3,32 ₸.

Где:

1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
0,83 ₸ — стоимость единицы тарификации.

Распознавание речи в асинхронном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном режиме со следующими параметрами:

Количество аудиофрагментов: 4.
Длительность аудиофрагментов: 5 секунд, 5 секунд, 15.5 секунд, 15.5 секунд.
Количество каналов в аудиофрагментах: 1, 3, 2, 4.

Расчет в рублях

Расчет в тенге

(15 + 30 + 16 + 32) × 0,0102 ₽ = 0,95 ₽

Итого: 0,95 ₽.

Где:

15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
0,0102 ₽ — стоимость единицы тарификации.

(15 + 30 + 16 + 32) × 0,0518 ₸ = 4,82 ₸

Итого: 4,82 ₸.

Где:

15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
0,0518 ₸ — стоимость единицы тарификации.

Распознавание речи в асинхронном отложенном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном отложенном режиме со следующими параметрами:

Количество аудиофрагментов: 3.
Длительность аудиофрагментов: 2 секунды, 14 секунд, 19.5 секунд.
Количество каналов в аудиофрагментах: 2, 3, 4.

Расчет в рублях

Расчет в тенге

(15 + 30 + 40) × 0,002542 ₽ = 0,22 ₽

Итого: 0,22 ₽.

Где:

15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
0,002542 ₽ — стоимость единицы тарификации.

(15 + 30 + 40) × 0,0129 ₸ = 1,10 ₸

Итого: 1,10 ₸.

Где:

15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
0,0129 ₸ — стоимость единицы тарификации.

Правила тарификации для SpeechKit

Из чего складывается стоимость использования SpeechKitИз чего складывается стоимость использования SpeechKit

Использование синтеза речиИспользование синтеза речи

API v1API v1

API v3API v3

Пустой запросПустой запрос

Внутренние ошибки сервераВнутренние ошибки сервера

Использование распознавания речиИспользование распознавания речи

Потоковый режим распознаванияПотоковый режим распознавания

Синхронное распознаваниеСинхронное распознавание

Асинхронное распознаваниеАсинхронное распознавание

Пустой запросПустой запрос

Внутренние ошибки сервераВнутренние ошибки сервера

Цены для региона РоссияЦены для региона Россия

Синтез речиСинтез речи

SpeechKit Brand VoiceSpeechKit Brand Voice

Распознавание речиРаспознавание речи

Примеры расчета стоимостиПримеры расчета стоимости

Синтез речи с использованием API v1Синтез речи с использованием API v1

Синтез речи с использованием API v3Синтез речи с использованием API v3

Распознавание речи в потоковом режимеРаспознавание речи в потоковом режиме

Распознавание речи в синхронном режимеРаспознавание речи в синхронном режиме

Распознавание речи в асинхронном режимеРаспознавание речи в асинхронном режиме

Распознавание речи в асинхронном отложенном режимеРаспознавание речи в асинхронном отложенном режиме

Была ли статья полезна?

Из чего складывается стоимость использования SpeechKit

Использование синтеза речи

API v1

API v3

Пустой запрос

Внутренние ошибки сервера

Использование распознавания речи

Потоковый режим распознавания

Синхронное распознавание

Асинхронное распознавание

Пустой запрос

Внутренние ошибки сервера

Цены для региона Россия

Синтез речи

SpeechKit Brand Voice

Распознавание речи

Примеры расчета стоимости

Синтез речи с использованием API v1

Синтез речи с использованием API v3

Распознавание речи в потоковом режиме

Распознавание речи в синхронном режиме

Распознавание речи в асинхронном режиме

Распознавание речи в асинхронном отложенном режиме