Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Foundation Models
  • Yandex Cloud ML SDK
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений

В этой статье:

  • Из чего складывается стоимость использования Yandex Foundation Models
  • Генерация текста
  • Классификация текста
  • Векторизация текста
  • Работа ассистентов
  • Генерация изображений
  • Внутренние ошибки сервера
  • Цены для региона Россия
  • Генерация текста
  • Классификация текста
  • Векторизация текста
  • Генерация изображений
  • Примеры расчета стоимости использования YandexGPT Lite и YandexGPT Pro
  • Примеры расчета генерации текста
  • Пример расчета векторизации текста

Правила тарификации для Yandex Foundation Models

Статья создана
Yandex Cloud
Обновлена 5 мая 2025 г.
  • Из чего складывается стоимость использования Yandex Foundation Models
    • Генерация текста
    • Классификация текста
    • Векторизация текста
    • Работа ассистентов
    • Генерация изображений
    • Внутренние ошибки сервера
  • Цены для региона Россия
    • Генерация текста
    • Классификация текста
    • Векторизация текста
    • Генерация изображений
  • Примеры расчета стоимости использования YandexGPT Lite и YandexGPT Pro
    • Примеры расчета генерации текста
    • Пример расчета векторизации текста

Чтобы рассчитать стоимость использования сервиса, ознакомьтесь с тарифами в этом разделе.

Цены на продукты сервиса также доступны в Прайс-листе.

В консоли управления новым пользователям без платежного аккаунта для тестирования доступны запросы к моделям:

  • YandexGPT Lite и YandexGPT Pro — 10 бесплатных запросов в час;
  • YandexART — 10 бесплатных запросов в сутки.

Из чего складывается стоимость использования Yandex Foundation ModelsИз чего складывается стоимость использования Yandex Foundation Models

Использование сервиса Foundation Models детализируется в Yandex Cloud Billing в единицах тарификации — тарифицирующих юнитах. Стоимость одного тарифицирующего юнита различается для генерации и векторизации текста.

Генерация текстаГенерация текста

Стоимость генерации текста рассчитывается из суммарного количества токенов промта и ответа и зависит от параметров запроса к моделям генерации. Следующие параметры влияют на стоимость генерации текста:

  • Модель, к которой приходит запрос.
  • Режим работы модели.

Число токенов в промте и ответе для одного и того же текста для разных моделей может отличаться.

При использовании моделей в пакетном режиме минимальная стоимость запуска — 200 000 токенов.

Итоговое количество потребленных юнитов вычисляется на основе суммарного числа токенов промта и ответа и округляется до целого значения в большую сторону.

ТокенизацияТокенизация

Использование токенизатора (вызовы TokenizerService и методы Tokenizer) не тарифицируются.

Дообученные моделиДообученные модели

На стадии Preview процесс дообучения моделей не тарифицируется. Использование дообученных моделей тарифицируется по правилам базовой модели:

  • Работа моделей, дообученных в Yandex DataSphere, тарифицируется по правилам YandexGPT Pro.
  • Работа дообученной модели YandexGPT Lite тарифицируется по правилам YandexGPT Lite.
  • Работа дообученной модели Llama 8B тарифицируется по правилам Llama 8B.

Классификация текстаКлассификация текста

Стоимость классификации текста зависит от используемой модели классификации и количества переданных токенов.

  • При классификации с помощью YandexGPT Lite единицей тарификации является 1 запрос до 1 000 токенов.
  • При классификациях с помощью YandexGPT Pro и дообученных классификаторов единицей тарификации является 1 запрос до 250 токенов.

Запросы, содержащие тексты меньше единицы тарификации, округляются в большую сторону до ближайшего целого. Тексты большего объема тарифицируются как несколько запросов с округлением в большую сторону.

Например, классификация текста длиной 770 токенов с помощью YandexGPT Lite будет тарифицироваться как один запрос (одна единица тарификации).
Тот же самый текст длиной 770 токенов при классификации с помощью YandexGPT Pro или дообученного классификатора будет тарифицироваться как четыре запроса.

Векторизация текстаВекторизация текста

Стоимость представления текста в виде векторов (получения эмбеддингов по тексту) зависит от объема текста, поданного на векторизацию.

Работа ассистентовРабота ассистентов

На стадии Preview использование AI Assistant API и хранение файлов не тарифицируется, но работа моделей оплачивается по правилам генерации текста.

Генерация изображенийГенерация изображений

Использование YandexART тарифицируется за каждый запрос на генерацию. При этом запросы не идемпотентны, поэтому два запроса с идентичными параметрами и промтом генерации считаются двумя самостоятельными запросами.

Внутренние ошибки сервераВнутренние ошибки сервера

Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.

Цены для региона РоссияЦены для региона Россия

Примечание

Цены на ресурсы Yandex Cloud в разных регионах отличаются. Подробнее о доступных регионах см. Регионы.

Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.

Генерация текстаГенерация текста

Цены в рублях
Цены в тенге
Количество Цена,
вкл. НДС
1000 юнитов 0,20 ₽
Количество Цена,
вкл. НДС
1000 юнитов 1,00 ₸

Стоимость использования моделей в синхронном и асинхронном режимеСтоимость использования моделей в синхронном и асинхронном режиме

Цены в рублях
Цены в тенге

Модель

Цена за 1000 токенов в синхронном режиме,
вкл. НДС

Цена за 1000 токенов в асинхронном режиме,
вкл. НДС

YandexGPT Lite

0,20 ₽

0,10 ₽

YandexGPT Pro

1,20 ₽

0,60 ₽

Модель, дообученная в DataSphere

1,20 ₽

0,60 ₽

Llama 8B

0,20 ₽

0,10 ₽

Llama 70B

1,20 ₽

0,60 ₽

Модель

Цена за 1000 токенов в синхронном режиме,
вкл. НДС

Цена за 1000 токенов в асинхронном режиме,
вкл. НДС

YandexGPT Lite

1,00 ₸

0,50 ₸

YandexGPT Pro

6,00 ₸

3,00 ₸

Модель, дообученная в DataSphere

6,00 ₸

3,00 ₸

Llama 8B

1,00 ₸

0,50 ₸

Llama 70B

6,00 ₸

3,00 ₸

Стоимость использования моделей в пакетном режимеСтоимость использования моделей в пакетном режиме

При использовании моделей в пакетном режиме минимальная стоимость запуска — 200 000 токенов.

Цены в рублях
Цены в тенге

Модель

Цена за 1000 токенов
в пакетном режиме,
вкл. НДС

Qwen2.5 7B Instruct

0,10 ₽

Qwen2.5 72B Instruct

0,60 ₽

QwQ 32B Instruct

0,40 ₽

Llama-3.3-70B-Instruct

0,60 ₽

Llama-3.1-70B-Instruct

0,60 ₽

DeepSeek-R1-Distill-Llama-70B

0,60 ₽

Qwen2.5 32B Instruct

0,40 ₽

DeepSeek-R1-Distill-Qwen-32B

0,40 ₽

phi-4

0,20 ₽

Qwen2 VL 7B

0,10 ₽

Qwen2.5 VL 7B

0,10 ₽

DeepSeek 2 VL

0,40 ₽

DeepSeek 2 VL Tiny

0,10 ₽

Gemma3 1B it

0,10 ₽

Gemma3 4B it

0,10 ₽

Gemma3 12B it

0,20 ₽

Gemma3 27B it

0,40 ₽

Qwen 2.5 VL 32B Instruct

0,40 ₽

Qwen3-0.6B

0,10 ₽

Qwen3-1.7B

0,10 ₽

Qwen3-4B

0,10 ₽

Qwen3-8B

0,10 ₽

Qwen3-14B

0,20 ₽

Qwen3-32B

0,40 ₽

Qwen3-30B-A3B

0,40 ₽

Qwen3-235B-A22B

6,00 ₽

Модель

Цена за 1000 токенов
в пакетном режиме,
вкл. НДС

Qwen2.5 7B Instruct

0,50 ₸

Qwen2.5 72B Instruct

3,00 ₸

QwQ 32B Instruct

2,00 ₸

Llama-3.3-70B-Instruct

3,00 ₸

Llama-3.1-70B-Instruct

3,00 ₸

DeepSeek-R1-Distill-Llama-70B

3,00 ₸

Qwen2.5 32B Instruct

2,00 ₸

DeepSeek-R1-Distill-Qwen-32B

2,00 ₸

phi-4

1,00 ₸

Qwen2 VL 7B

0,50 ₸

Qwen2.5 VL 7B

0,50 ₸

DeepSeek 2 VL

2,00 ₸

DeepSeek 2 VL Tiny

0,50 ₸

Gemma3 1B it

0,50 ₸

Gemma3 4B it

0,50 ₸

Gemma3 12B it

1,00 ₸

Gemma3 27B it

2,00 ₸

Qwen 2.5 VL 32B Instruct

2,00 ₸

Qwen3-0.6B

0,50 ₸

Qwen3-1.7B

0,50 ₸

Qwen3-4B

0,50 ₸

Qwen3-8B

0,50 ₸

Qwen3-14B

1,00 ₸

Qwen3-32B

2,00 ₸

Qwen3-30B-A3B

2,00 ₸

Qwen3-235B-A22B

30,00 ₸

Классификация текстаКлассификация текста

Цены в рублях
Цены в тенге
Услуга Цена,
вкл. НДС
1 запрос (1 000 токенов) на классификацию помощью YandexGPT Lite 0,15 ₽
1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro 0,15 ₽
1 запрос (250 токенов) к дообученному классификатору 0,15 ₽
Услуга Цена,
вкл. НДС
1 запрос (1 000 токенов) на классификацию помощью YandexGPT Lite 0,75 ₸
1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro 0,75 ₸
1 запрос (250 токенов) к дообученному классификатору 0,75 ₸

Векторизация текстаВекторизация текста

Цены в рублях
Цены в тенге
Количество Цена,
вкл. НДС
1000 юнитов 0,01 ₽
Количество Цена,
вкл. НДС
1000 юнитов 0,05 ₸
Цены в рублях
Цены в тенге
Параметры модели Количество юнитов
в 1 токене
Итоговая стоимость за обработку 1000 токенов,
вкл. НДС
Получение эмбеддингов текста 1 0,01 ₽
Параметры модели Количество юнитов
в 1 токене
Стоимость за обработку 1000 токенов,
вкл. НДС
Получение эмбеддингов текста 1 0,05 ₸

Генерация изображенийГенерация изображений

Цены в рублях
Цены в тенге
Услуга Цена,
вкл. НДС
1 запрос на генерацию изображения с помощью YandexART 2,20 ₽
Услуга Цена,
вкл. НДС
1 запрос на генерацию изображения с помощью YandexART 11,00 ₸

Примеры расчета стоимости использования YandexGPT Lite и YandexGPT ProПримеры расчета стоимости использования YandexGPT Lite и YandexGPT Pro

Примеры расчета генерации текстаПримеры расчета генерации текста

Пример 1Пример 1

Стоимость использования YandexGPT Lite для генерации текста со следующими параметрами:

  • Количество токенов в промте — 225.
  • Количество токенов в ответе — 525.
  • Модель YandexGPT Lite.
  • Синхронный режим работы модели.
Расчет в рублях
Расчет в тенге
  • Количество токенов в промте и ответе: 225 + 525 = 750.
  • Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1.
  • Общее количество юнитов в детализации потребления: 750.

(0,20 ₽ / 1000 юнитов) × 750 юнитов = 0,15 ₽

  • Количество токенов в промте и ответе: 225 + 525 = 750.
  • Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1.
  • Общее количество юнитов в детализации потребления: 750.

(1,00 ₸ / 1000 юнитов) × 750 юнитов = 0,75 ₸

Пример 2Пример 2

Стоимость использования YandexGPT Pro для генерации текста со следующими параметрами:

  • Количество токенов в промте — 115.
  • Количество токенов в ответе — 1500.
  • Модель YandexGPT Pro.
  • Асинхронный режим работы модели.
Расчет в рублях
Расчет в тенге
  • Количество токенов в промте и ответе: 115 + 1500 = 1615.
  • Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 0,60 ₽.
  • Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
  • Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.

Итого: (0,60 ₽ / 1000 токенов) × 1615 токенов = 0,969 ₽, округляя до целого значения, 0,97 ₽.

  • Количество токенов в промте и ответе: 115 + 1500 = 1615.
  • Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 3,00 ₸.
  • Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
  • Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.

Итого: (3,00 ₸ / 1000 токенов) × 1615 токенов = 4,845 ₸, округляя до целого значения, 4,85 ₸.

Пример 3Пример 3

Стоимость использования YandexGPT Pro и DataSphere для генерации текста со следующими параметрами:

  • Количество токенов в промте — 1020.
  • Количество токенов в ответе — 30.
  • Модель YandexGPT Pro, дообученная в DataSphere.
  • Синхронный режим работы модели.
Расчет в рублях
Расчет в тенге
  • Количество токенов в промте и ответе: 1020 + 30 = 1050.
  • Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 1,20 ₽.
  • Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6.
  • Общее количество юнитов в детализации потребления: 1050 × 6 = 6300.

Итого: (0,20 ₽ / 1000 юнитов) × 6300 юнитов = 1,26 ₽ или (1,20 ₽ / 1000 токенов) × 1050 токенов = 1,26 ₽.

  • Количество токенов в промте и ответе: 1020 + 30 = 1050.
  • Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 6,00 ₸.
  • Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6.
  • Общее количество юнитов в детализации потребления: 1050 × 6 = 6300.

Итого: (1,00 ₸ / 1000 юнитов) × 6300 юнитов = 6,30 ₸ или (6,00 ₸ / 1000 токенов) × 1050 токенов = 6,30 ₸.

Пример расчета векторизации текстаПример расчета векторизации текста

Стоимость использования Yandex Foundation Models для векторизации текста со следующим параметром:

  • Число токенов в запросе — 2000.
Расчет в рублях
Расчет в тенге
  • 0,01 ₽ — стоимость обработки 1000 токенов.
  • 0,01 ₽ / 1000 — стоимость обработки 1 токена.

2000 × (0,01 ₽ / 1000) = 0,02 ₽

Итого: 0,02 ₽.

  • 0,05 ₸ — стоимость обработки 1000 токенов.
  • 0,05 ₸ / 1000 — стоимость обработки 1 токена.

2000 × (0,05 ₸ / 1000) = 0,10 ₸

Итого: 0,10 ₸.

Была ли статья полезна?

Предыдущая
Управление доступом
Следующая
Публичные материалы
Проект Яндекса
© 2025 ООО «Яндекс.Облако»