Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Калькулятор цен
    • Тарифы
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex SpeechKit
  • Обзор технологий SpeechKit
    • О технологии
    • Системные требования
    • Документация SpeechKit Hybrid
  • Поддерживаемые форматы аудио
  • Интеграция телефонии
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails

В этой статье:

  • Аппаратные требования к серверам STT и TTS
  • Примеры расчета оборудования для серверов STT и TTS
  • Программные требования
  1. SpeechKit Hybrid
  2. Системные требования

Системные требования

Статья создана
Yandex Cloud
Обновлена 20 ноября 2025 г.
  • Аппаратные требования к серверам STT и TTS
    • Примеры расчета оборудования для серверов STT и TTS
  • Программные требования

Для установки SpeechKit Hybrid вам необходим сервер с ОС Linux, который поддерживает Docker Engine. Список поддерживаемых ОС см. в официальной документации Docker.

Важно

Процессор должен поддерживать набор инструкций AVX2 (Advanced Vector Support).

В Linux вы можете проверить, поддерживает ли ваш хост AVX2, командой:

grep -q avx2 /proc/cpuinfo && echo AVX2 || echo No AVX2

Аппаратные требования к серверам STT и TTSАппаратные требования к серверам STT и TTS

Рекомендуемые аппаратные требования для запуска контейнеров SpeechKit Hybrid. Расчетные значения характеристик SpeechKit Hybrid приведены для справки на основе оборудования, использующего драйвер NVIDIA 535. Точные значение могут измениться после обновления контейнеров и появления новых функций.

Данные в таблицах представлены только для русского языка:

Контейнеры с GPU T4
Контейнеры с GPU V100
Контейнеры с GPU L4
Контейнеры с GPU A100
Контейнеры с GPU H100
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 50 64 200 8 16
Распознавание аудиофайлов 250 64 200 8 16
Синтез речи
Синтез 80 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 110 64 200 8 16
Распознавание аудиофайлов 500 64 200 8 16
Синтез речи
Синтез 200 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 66 64 200 8 16
Распознавание аудиофайлов 330 64 200 8 16
Синтез речи
Синтез 383 64 200 8 16
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 245 64 200 14 28
Распознавание аудиофайлов 1000 64 200 14 28
Синтез речи
Синтез 480 64 200 14 28
Режим работы Гарантированный
SPS1
RAM на 1 карту,
ГБ
HDD на 1 карту,
ГБ
Физические ядра
процессора
Intel Gold 6230R
на 1 карту, шт
Логические ядра
Intel Gold 6230R
на 1 карту, шт
Распознавание речи
Потоковое распознавание 110 64 200 8 16
Распознавание аудиофайлов 500 64 200 8 16
Синтез речи
Синтез 200 64 200 8 16

1 Seconds per second (SPS) — количество секунд распознанного или синтезированного текста за секунду работы.

Примеры расчета оборудования для серверов STT и TTSПримеры расчета оборудования для серверов STT и TTS

Количество карт, необходимых для распознавания или синтеза текста, зависит от SPS. Для расчета воспользуйтесь формулой:

Потоковое распознавание
Распознавание аудиофайлов
Синтез

SPS пользователя = X × Y

Где:

  • X — доля разговора, когда включено распознавание. Если нужно перебивание, то X = 1.
  • Y — количество одновременных звонков.

SPS пользователя = X / Y

Где:

  • X — длительность распознаваемого аудио, в секундах.
  • Y — время на распознавание аудио, в секундах.

SPS пользователя = X × (Y / 10)

Где:

  • X — ожидаемое число запросов в секунду.
  • Y — средняя длина запроса в символах.

Количество карт рассчитывается по формуле:

SPS пользователя / гарантированный SPS карты

Итоговое значение округляется вверх до целого.

Чтобы получить необходимое количество RAM, HDD и ядер, умножьте значения из таблицы на число карт.

Программные требованияПрограммные требования

Для установки и настройки сервисов SpeechKit Hybrid:

  • Установите интерфейс командной строки Yandex Cloud.
  • Создайте реестр Yandex Container Registry.

Была ли статья полезна?

Предыдущая
О технологии
Следующая
Документация SpeechKit Hybrid
Проект Яндекса
© 2025 ООО «Яндекс.Облако»