Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации

В этой статье:

  • Из чего складывается стоимость использования SpeechKit
  • Использование синтеза речи
  • Использование распознавания речи
  • Цены для региона Россия
  • Синтез речи
  • SpeechKit Brand Voice
  • Распознавание речи
  • Примеры расчета стоимости
  • Синтез речи с использованием API v1
  • Синтез речи с использованием API v3
  • Распознавание речи в потоковом режиме
  • Распознавание речи в синхронном режиме
  • Распознавание речи в асинхронном режиме
  • Распознавание речи в асинхронном отложенном режиме

Правила тарификации для SpeechKit

Статья создана
Yandex Cloud
Обновлена 5 мая 2025 г.
  • Из чего складывается стоимость использования SpeechKit
    • Использование синтеза речи
    • Использование распознавания речи
  • Цены для региона Россия
    • Синтез речи
    • SpeechKit Brand Voice
    • Распознавание речи
  • Примеры расчета стоимости
    • Синтез речи с использованием API v1
    • Синтез речи с использованием API v3
    • Распознавание речи в потоковом режиме
    • Распознавание речи в синхронном режиме
    • Распознавание речи в асинхронном режиме
    • Распознавание речи в асинхронном отложенном режиме

Совет

Чтобы рассчитать стоимость синтеза и распознавания речи, воспользуйтесь калькулятором на сайте Yandex Cloud или ознакомьтесь с тарифами в этом разделе.

Цены на продукты сервиса также доступны в Прайс-листе.

Из чего складывается стоимость использования SpeechKitИз чего складывается стоимость использования SpeechKit

Использование синтеза речиИспользование синтеза речи

Стоимость использования SpeechKit для синтеза речи зависит от версии используемого API.

API v1API v1

Для API v1 стоимость рассчитывается исходя из суммарного количества символов, которые были отправлены для генерации речи из текста за календарный месяц (Отчетный период).

API v3API v3

Стоимость использования API v3 зависит от количества отправленных запросов на синтез. Стоимость рассчитывается за календарный месяц (Отчетный период).

По умолчанию запросы на синтез речи имеют ограничения — 250 символов и 24 секунды. Для синтеза более длинных фраз можно использовать режим unsafe_mode. Тогда тарифицироваться будут каждые 250 символов, например:

  • Запрос меньше 250 символов — одна единица тарификации.
  • Запрос от 250 до 500 символов — две единицы тарификации.
  • Запрос от 500 до 750 символов — три единицы тарификации.

Пустой запросПустой запрос

Количество символов в запросе определяется с учетом пробелов и служебных символов. Стоимость пустого запроса зависит от версии API:

  • Пустой запрос к API v1 тарифицируется как один символ.
  • Пустой запрос к API v3 тарифицируется как одна единица тарификации.

Внутренние ошибки сервераВнутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Использование распознавания речиИспользование распознавания речи

Стоимость использования SpeechKit для распознавания речи зависит от типа распознавания и длительности распознанного аудио. Стоимость рассчитывается за календарный месяц (Отчетный период).

Потоковый режим распознаванияПотоковый режим распознавания

Стоимость использования SpeechKit в режиме потокового распознавания рассчитывается по правилам тарификации синхронного распознавания.

Синхронное распознаваниеСинхронное распознавание

Эти правила действуют при использовании синхронного распознавания и распознавания в потоковом режиме при использовании API v2 и API v3.

Единица тарификации — отрезок одноканального аудио длительностью 15 секунд. Отрезки меньшей длительности округляются в большую сторону (1 секунда превращается в 15 секунд).

Важно

В потоковом режиме тарификация начинается с отправки сообщения с настройками распознавания. Если вы не отправляли аудио после этого сообщения, оно будет считаться как использованная единица тарификации.

Примеры^

  • 1 аудиофрагмент 37 секунд тарифицируется как 45 секунд.

    Объяснение: аудио разбивается на 2 отрезка по 15 секунд и один отрезок 7 секунд. Длительность последнего отрезка будет округлена до 15 секунд. Итого, 3 отрезка по 15 секунд.

  • 2 аудиофрагмента по 5 и 8 секунд тарифицируются как 30 секунд.

    Объяснение: длительность каждого аудио будет округлена до 15 секунд. Итого, 2 отрезка по 15 секунд.

Асинхронное распознаваниеАсинхронное распознавание

Эти правила действуют при использовании асинхронного распознавания.

Единица тарификации — 1 секунда двухканального аудио. Отрезки меньшей длительности округляются в большую сторону. Количество каналов округляется до четного числа.

Минимум начисляется 15 секунд за каждые два канала. Аудио меньшей длительности тарифицируется, как 15 секунд.

Примеры с округлением длительности аудио:

Длительность Количество каналов Начислено секунд
1 секунда 1 15
1 секунда 2 15
1 секунда 3 30
15.5 секунд 2 16
15.5 секунд 4 32

Пустой запросПустой запрос

Пустой запрос к любому типу распознавания равен стоимости одной единицы тарификации.

Внутренние ошибки сервераВнутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Цены для региона РоссияЦены для региона Россия

Примечание

Цены на ресурсы Yandex Cloud в разных регионах отличаются. Подробнее о доступных регионах см. Регионы.

Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.

Синтез речиСинтез речи

Цены в рублях
Цены в тенге
Услуга Цена за единицу тарификации,
вкл. НДС
Синтез с использованием API v1, за 1 млн символов 1 320,00 ₽
Синтез с использованием API v3, за запрос 0,16 ₽
Услуга Цена за единицу тарификации,
вкл. НДС
Синтез с использованием API v1, за 1 млн символов 6 600,00 ₸
Синтез с использованием API v3, за запрос 0,80 ₸

SpeechKit Brand VoiceSpeechKit Brand Voice

Цены в рублях
Цены в тенге
Услуга Цена за единицу тарификации, вкл. НДС
Хостинг модели SpeechKit Brand Voice Self Service, за месяц 240 000 ₽
Хостинг модели SpeechKit Brand Voice Premium, за месяц По запросу
Запрос к модели SpeechKit Brand Voice Call Center 0,16 ₽
Запрос к модели SpeechKit Brand Voice Self Service 0,16 ₽
Запрос к модели SpeechKit Brand Voice Premium 0,16 ₽
Услуга Цена за единицу тарификации, вкл. НДС
Хостинг модели SpeechKit Brand Voice Self Service, за месяц 1 200 000 ₸
Хостинг модели SpeechKit Brand Voice Premium, за месяц По запросу
Запрос к модели SpeechKit Brand Voice Call Center 0,80 ₸
Запрос к модели SpeechKit Brand Voice Self Service 0,80 ₸
Запрос к модели SpeechKit Brand Voice Premium 0,80 ₸

Распознавание речиРаспознавание речи

Цены в рублях
Цены в тенге
Услуга Цена за 15 секунд аудио,
вкл. НДС
Потоковое распознавание 0,16 ₽
Синхронное распознавание файлов 0,16 ₽
Асинхронное распознавание файлов* 0,15 ₽
Асинхронное распознавание файлов, отложенный режим* 0,0375 ₽

* Посекундная тарификация с 16 секунды.

Услуга Цена за 15 секунд аудио,
вкл. НДС
Потоковое распознавание 0,80 ₸
Синхронное распознавание файлов 0,80 ₸
Асинхронное распознавание файлов* 0,75 ₸
Асинхронное распознавание файлов, отложенный режим* 0,1875 ₸

* Посекундная тарификация с 16 секунды.

Примеры расчета стоимостиПримеры расчета стоимости

Синтез речи с использованием API v1Синтез речи с использованием API v1

Стоимость использования SpeechKit для синтеза речи с использованием API v1 со следующими параметрами:

  • Количество символов, отправленных за месяц: 2023.
Расчет в рублях
Расчет в тенге

2023 × (1 320,00 ₽ / 1 000 000) = 2,67 ₽

Итого: 2,67 ₽.

Где:

  • 1 320,00 ₽ — стоимость за 1 млн символов.
  • 1 320,00 ₽ / 1 000 000 — стоимость за 1 символ.

2023 × (6 600,00 ₸ / 1 000 000) = 13,35 ₸

Итого: 13,35 ₸.

Где:

  • 6 600,00 ₸ — стоимость за 1 млн символов.
  • 6 600,00 ₸ / 1 000 000 — стоимость за 1 символ.

Синтез речи с использованием API v3Синтез речи с использованием API v3

Стоимость использования SpeechKit для синтеза речи с использованием API v3 со следующими параметрами:

  • Количество отправленных запросов: 3.
  • Количество символов в запросах: 150, 300, 600.
Расчет в рублях
Расчет в тенге

(1 + 2 + 3) × 0,16 ₽ = 0,96 ₽

Итого: 0,96 ₽.

Где:

  • 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
  • 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима unsafe_mode.
  • 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима unsafe_mode.
  • 0,16 ₽ — стоимость единицы тарификации.

(1 + 2 + 3) × 0,80 ₸ = 4,80 ₸

Итого: 4,80 ₸.

Где:

  • 1 — количество единиц тарификации за первый запрос, содержащий 150 символов.
  • 2 — количество единиц тарификации за второй запрос, содержащий 300 символов, с использованием режима unsafe_mode.
  • 3 — количество единиц тарификации за третий запрос, содержащий 600 символов, с использованием режима unsafe_mode.
  • 0,80 ₸ — стоимость единицы тарификации.

Распознавание речи в потоковом режимеРаспознавание речи в потоковом режиме

Стоимость использования SpeechKit для распознавания речи в потоковом режиме со следующими параметрами:

  • Количество аудиофрагментов: 2.
  • Длительность аудиофрагментов: 5 секунд, 37 секунд.
Расчет в рублях
Расчет в тенге

(1 + 3) × 0,16 ₽ = 0,64 ₽

Итого: 0,64 ₽.

Где:

  • 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
  • 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
  • 0,16 ₽ — стоимость единицы тарификации.

(1 + 3) × 0,80 ₸ = 3,20 ₸

Итого: 3,20 ₸.

Где:

  • 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд и учетом сообщения с настройками распознавания.
  • 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд и учетом сообщения с настройками распознавания.
  • 0,80 ₸ — стоимость единицы тарификации.

Распознавание речи в синхронном режимеРаспознавание речи в синхронном режиме

Стоимость использования SpeechKit для распознавания речи в синхронном режиме со следующими параметрами:

  • Количество аудиофрагментов: 2.
  • Длительность аудиофрагментов: 5 секунд, 37 секунд.
Расчет в рублях
Расчет в тенге

(1 + 3) × 0,16 ₽ = 0,64 ₽

Итого: 0,64 ₽.

Где:

  • 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
  • 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
  • 0,16 ₽ — стоимость единицы тарификации.

(1 + 3) × 0,80 ₸ = 3,20 ₸

Итого: 3,20 ₸.

Где:

  • 1 — количество единиц тарификации за первый аудиофрагмент длительностью 5 секунд, с округлением до 15 секунд.
  • 3 — количество единиц тарификации за второй аудиофрагмент длительностью 37 секунд, с округлением до 45 секунд.
  • 0,80 ₸ — стоимость единицы тарификации.

Распознавание речи в асинхронном режимеРаспознавание речи в асинхронном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном режиме со следующими параметрами:

  • Количество аудиофрагментов: 4.
  • Длительность аудиофрагментов: 5 секунд, 5 секунд, 15.5 секунд, 15.5 секунд.
  • Количество каналов в аудиофрагментах: 1, 3, 2, 4.
Расчет в рублях
Расчет в тенге

(15 + 30 + 16 + 32) × 0,01 ₽ = 0,93 ₽

Итого: 0,93 ₽.

Где:

  • 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
  • 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
  • 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
  • 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
  • 0,01 ₽ — стоимость единицы тарификации.

(15 + 30 + 16 + 32) × 0,05 ₸ = 4,65 ₸

Итого: 4,65 ₸.

Где:

  • 15 — количество единиц тарификации за первый 1-канальный аудиофрагмент длительностью 5 секунд, с округлением до двух каналов и 15 секунд.
  • 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 5 секунд, с округлением до четырех каналов и 15 секунд.
  • 16 — количество единиц тарификации за третий 2-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
  • 32 — количество единиц тарификации за четвертый 4-канальный аудиофрагмент длительностью 15.5 секунд, с округлением до 16 секунд.
  • 0,05 ₸ — стоимость единицы тарификации.

Распознавание речи в асинхронном отложенном режимеРаспознавание речи в асинхронном отложенном режиме

Стоимость использования SpeechKit для распознавания речи в асинхронном отложенном режиме со следующими параметрами:

  • Количество аудиофрагментов: 3.
  • Длительность аудиофрагментов: 2 секунды, 14 секунд, 19.5 секунд.
  • Количество каналов в аудиофрагментах: 2, 3, 4.
Расчет в рублях
Расчет в тенге

(15 + 30 + 40) × 0,0025 ₽ = 0,21 ₽

Итого: 0,21 ₽.

Где:

  • 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
  • 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
  • 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
  • 0,0025 ₽ — стоимость единицы тарификации.

(15 + 30 + 40) × 0,0125 ₸ = 1,06 ₸

Итого: 1,06 ₸.

Где:

  • 15 — количество единиц тарификации за первый 2-канальный аудиофрагмент длительностью 2 секунды, с округлением до 15 секунд.
  • 30 — количество единиц тарификации за второй 3-канальный аудиофрагмент длительностью 14 секунд, с округлением до четырех каналов и 15 секунд.
  • 40 — количество единиц тарификации за третий 4-канальный аудиофрагмент длительностью 19.5 секунд, с округлением до 20 секунд.
  • 0,0125 ₸ — стоимость единицы тарификации.

Была ли статья полезна?

Предыдущая
Управление доступом
Следующая
Релизы распознавания
Проект Яндекса
© 2025 ООО «Яндекс.Облако»