Правила тарификации для Yandex Foundation Models
Чтобы рассчитать стоимость использования сервиса, ознакомьтесь с тарифами в этом разделе.
Цены на продукты сервиса также доступны в Прайс-листе.
В консоли управления
- YandexGPT API — 10 бесплатных запросов в час;
- YandexART — 10 бесплатных запросов в сутки.
Из чего складывается стоимость использования Yandex Foundation Models
Единица тарификации
Использование сервиса Foundation Models детализируется в единицах тарификации — тарифицирующих юнитах. Стоимость одного тарифицирующего юнита различается для генерации и векторизации текста.
Генерация текста
Стоимость генерации текста рассчитывается из суммарного количества токенов промта и ответа и зависит от параметров запроса к моделям генерации. Следующие параметры влияют на стоимость генерации текста:
- Модель, к которой приходит запрос.
- Режим работы модели.
Число токенов в промте и ответе для одного и того же текста для разных моделей может отличаться.
Итоговое количество потребленных юнитов вычисляется на основе суммарного числа токенов промта и ответа и округляется до целого значения в большую сторону.
Токенизация
Использование токенизатора (вызовы TokenizerService и методы Tokenizer) не тарифицируются.
Дообученные модели
На стадии Preview процесс дообучения моделей не тарифицируется. Использование дообученных моделей тарифицируется по правилам базовой модели:
- Работа моделей, дообученных в Yandex DataSphere, тарифицируется по правилам YandexGPT Pro.
- Работа дообученной модели YandexGPT Lite тарифицируется по правилам YandexGPT Lite.
- Работа дообученной модели Llama 8b1 тарифицируется по правилам Llama 8b.
Классификация текста
Важно
Правила, описанные ниже, начнут действовать с 9 декабря 2024 года.
Стоимость классификации текста зависит от используемой модели классификации и количества переданных токенов.
- При классификации с помощью YandexGPT Lite единицей тарификации является 1 запрос до 1 000 токенов.
- При классификациях с помощью YandexGPT Pro и дообученных классификаторов единицей тарификации является 1 запрос до 250 токенов.
Запросы, содержащие тексты меньше единицы тарификации, округляются в большую сторону до ближайшего целого. Тексты большего объема тарифицируются как несколько запросов с округлением в большую сторону.
Например, классификация текста длиной 770 токенов с помощью YandexGPT Lite будет тарифицироваться как один запрос (одна единица тарификации).
Тот же самый текст длиной 770 токенов при классификации с помощью YandexGPT Pro или дообученного классификатора будет тарифицироваться как четыре запроса.
Векторизация текста
Стоимость представления текста в виде векторов (получения эмбеддингов по тексту) зависит от объема текста, поданного на векторизацию.
Работа ассистентов
На стадии Preview использование AI Assistant API и хранение файлов не тарифицируется, но работа моделей оплачивается по правилам генерации текста.
Генерация изображений
Использование YandexART тарифицируется за каждый запрос на генерацию. При этом запросы не идемпотентны, поэтому два запроса с идентичными параметрами и промтом генерации считаются двумя самостоятельными запросами.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.
Цены для региона Россия
Важно
Цены на ресурсы Yandex Cloud в разных регионах отличаются. Подробнее о доступных регионах см. Регионы.
Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.
Генерация текста
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 0,20 ₽ |
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 1,00 ₸ |
Параметры модели | Количество юнитовв 1 токене | Цена за 1000 токенов,вкл. НДС |
---|---|---|
YandexGPT Lite, синхронный режим | 1 | 0,20 ₽ |
YandexGPT Lite, асинхронный режим | 0,5 | 0,10 ₽ |
YandexGPT Pro, синхронный режим | 6 | 1,20 ₽ |
YandexGPT Pro, асинхронный режим | 3 | 0,60 ₽ |
Модель, дообученная в DataSphere, синхронный режим | 6 | 1,20 ₽ |
Модель, дообученная в DataSphere, асинхронный режим | 3 | 0,60 ₽ |
Llama 8b1, синхронный режим | 1 | 0,20 ₽ |
Llama 8b, асинхронный режим | 0,5 | 0,10 ₽ |
Llama 70b1, синхронный режим | 6 | 1,20 ₽ |
Llama 70b, асинхронный режим | 3 | 0,60 ₽ |
Параметры модели | Количество юнитовв 1 токене | Цена за 1000 токенов, вкл. НДС |
---|---|---|
YandexGPT Lite, синхронный режим | 1 | 1,00 ₸ |
YandexGPT Lite, асинхронный режим | 0,5 | 0,50 ₸ |
YandexGPT Pro, синхронный режим | 6 | 6,00 ₸ |
YandexGPT Pro, асинхронный режим | 3 | 3,00 ₸ |
Модель, дообученная в DataSphere, синхронный режим | 6 | 6,00 ₸ |
Модель, дообученная в DataSphere, асинхронный режим | 3 | 3,00 ₸ |
Llama 8b1, синхронный режим | 1 | 1,00 ₸ |
Llama 8b, асинхронный режим | 0,5 | 0,50 ₸ |
Llama 70b1, синхронный режим | 6 | 6,00 ₸ |
Llama 70b, асинхронный режим | 3 | 3,00 ₸ |
Классификация текста
Услуга | Цена, вкл. НДС |
---|---|
1 запрос (1 000 токенов) на классификацию помощью YandexGPT Lite | 0,15 ₽ |
1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro | 0,15 ₽ |
1 запрос (250 токенов) к дообученному классификатору | 0,15 ₽ |
Услуга | Цена, вкл. НДС |
---|---|
1 запрос (1 000 токенов) на классификацию помощью YandexGPT Lite | 0,75 ₸ |
1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro | 0,75 ₸ |
1 запрос (250 токенов) к дообученному классификатору | 0,75 ₸ |
Векторизация текста
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 0,01 ₽ |
Количество | Цена, вкл. НДС |
---|---|
1000 юнитов | 0,05 ₸ |
Параметры модели | Количество юнитовв 1 токене | Итоговая стоимость за обработку 1000 токенов, вкл. НДС |
---|---|---|
Получение эмбеддингов текста | 1 | 0,01 ₽ |
Параметры модели | Количество юнитовв 1 токене | Стоимость за обработку 1000 токенов, вкл. НДС |
---|---|---|
Получение эмбеддингов текста | 1 | 0,05 ₸ |
Генерация изображений
Услуга | Цена, вкл. НДС |
---|---|
1 запрос на генерацию изображения с помощью YandexART | 2,20 ₽ |
Услуга | Цена, вкл. НДС |
---|---|
1 запрос на генерацию изображения с помощью YandexART | 11,00 ₸ |
Примеры расчета стоимости использования YandexGPT API
Примеры расчета генерации текста
Пример 1
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- Количество токенов в промте — 225.
- Количество токенов в ответе — 525.
- Модель YandexGPT Lite.
- Синхронный режим работы модели.
- Количество токенов в промте и ответе: 225 + 525 = 750.
- Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1.
- Общее количество юнитов в детализации потребления: 750.
(0,20 ₽ / 1000 юнитов) × 750 юнитов = 0,15 ₽
- Количество токенов в промте и ответе: 225 + 525 = 750.
- Количество юнитов в 1 токене для модели YandexGPT Lite в синхронном режиме: 1.
- Общее количество юнитов в детализации потребления: 750.
(1,00 ₸ / 1000 юнитов) × 750 юнитов = 0,75 ₸
Пример 2
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- Количество токенов в промте — 115.
- Количество токенов в ответе — 1500.
- Модель YandexGPT Pro.
- Асинхронный режим работы модели.
- Количество токенов в промте и ответе: 115 + 1500 = 1615.
- Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 0,60 ₽.
- Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
- Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.
Итого: (0,60 ₽ / 1000 токенов) × 1615 токенов = 0,969 ₽, округляя до целого значения, 0,97 ₽.
- Количество токенов в промте и ответе: 115 + 1500 = 1615.
- Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 3,00 ₸.
- Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
- Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.
Итого: (3,00 ₸ / 1000 токенов) × 1615 токенов = 4,845 ₸, округляя до целого значения, 4,85 ₸.
Пример 3
Стоимость использования YandexGPT API для генерации текста со следующими параметрами:
- Количество токенов в промте — 1020.
- Количество токенов в ответе — 30.
- Модель YandexGPT Pro, дообученная в DataSphere.
- Синхронный режим работы модели.
- Количество токенов в промте и ответе: 1020 + 30 = 1050
- Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 1,20 ₽
- Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6
- Общее количество юнитов в детализации потребления: 1050 × 6 = 6300
Итого: (0,20 ₽ / 1000 юнитов) × 6300 юнитов = 1,26 ₽ или (1,20 ₽ / 1000 токенов) × 1050 токенов = 1,26 ₽.
- Количество токенов в промте и ответе: 1020 + 30 = 1050
- Цена за 1000 токенов для модели, дообученной в DataSphere, в синхронном режиме: 6,00 ₸
- Количество юнитов в 1 токене для модели, дообученной в DataSphere, в синхронном режиме: 6
- Общее количество юнитов в детализации потребления: 1050 × 6 = 6300
Итого: (1,00 ₸ / 1000 юнитов) × 6300 юнитов = 6,30 ₸ или (6,00 ₸ / 1000 токенов) × 1050 токенов = 6,30 ₸.
Пример расчета векторизации текста
Стоимость использования YandexGPT API для векторизации текста со следующим параметром:
- Число токенов в запросе — 2000.
- 0,01 ₽ — стоимость обработки 1000 токенов.
- 0,01 ₽ / 1000 — стоимость обработки 1 токена.
2000 × (0,01 ₽ / 1000) = 0,02 ₽
Итого: 0,02 ₽.
- 0,05 ₸ — стоимость обработки 1000 токенов.
- 0,05 ₸ / 1000 — стоимость обработки 1 токена.
2000 × (0,05 ₸ / 1000) = 0,10 ₸
Итого: 10,00 ₸.
1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.