Правила тарификации для Yandex AI Studio
Чтобы рассчитать стоимость использования сервиса, ознакомьтесь с тарифами в этом разделе.
Цены на продукты сервиса также доступны в Прайс-листе.
Все цены указаны с включением НДС.
Цены для региона Россия
Важно
С 1 января 2026 года ставка НДС в Казахстане увеличится на 4%. Подробнее об изменении тарификации сервисов читайте в блоге.
Примечание
Цены на ресурсы Yandex Cloud в разных регионах различаются. Подробнее о доступных регионах см. Регионы.
Валюта, которой можно оплачивать ресурсы, зависит от юридического лица, с которым пользователь заключил договор. Подробнее о регистрации аккаунта см. Регистрация аккаунта в Yandex Cloud.
Model Gallery
Стоимость работы с моделями Model Gallery зависит от:
- режима работы модели;
- количества входящих и исходящих токенов. Число токенов в одном и том же тексте для разных моделей может отличаться. Пример расчета стоимости обработки одного и того же текста в синхронном режиме с помощью разных моделей.
Использование моделей Model Gallery детализируется в Yandex Cloud Billing в единицах тарификации — юнитах. Итоговое количество потребленных юнитов округляется до целого значения в большую сторону.
| Количество | Цена, вкл. НДС |
|---|---|
| 1000 юнитов | 0,20 ₽ |
| Количество | Цена, вкл. НДС |
|---|---|
| 1000 юнитов | 1,00 ₸ |
Использование моделей базового инстанса
|
Модель |
Цена за 1000 входящих токенов в синхронном режиме,вкл. НДС |
Цена за 1000 исходящих токенов в синхронном режиме,вкл. НДС |
Цена за 1000 входящих токенов в асинхронном режиме,вкл. НДС |
Цена за 1000 исходящих токенов в асинхронном режиме,вкл. НДС |
|
Alice AI LLM |
0,50 ₽ |
2,00 ₽ |
0,25 ₽ |
1,00 ₽ |
|
YandexGPT Pro 5.1 |
0,40 ₽ 1 |
0,40 ₽ 1 |
0,20 ₽ 1 |
0,20 ₽ 1 |
|
YandexGPT Pro 5 или младше |
1,20 ₽ |
1,20 ₽ |
0,60 ₽ |
0,60 ₽ |
|
YandexGPT Lite |
0,20 ₽ |
0,20 ₽ |
0,10 ₽ |
0,10 ₽ |
|
Qwen3 235B |
0,50 ₽ 1 |
0,50 ₽ 1 |
— |
— |
|
gpt-oss-120b |
0,30 ₽ |
0,30 ₽ |
— |
— |
|
gpt-oss-20b |
0,10 ₽ |
0,10 ₽ |
— |
— |
|
Gemma3 27B |
0,40 ₽ 1 |
0,40 ₽ 1 |
— |
— |
1 Цена указана с учетом действующей скидки 50%.
|
Модель |
Цена за 1000 входящих токенов в синхронном режиме,вкл. НДС |
Цена за 1000 исходящих токенов в синхронном режиме,вкл. НДС |
Цена за 1000 входящих токенов в асинхронном режиме,вкл. НДС |
Цена за 1000 исходящих токенов в асинхронном режиме,вкл. НДС |
|
Alice AI LLM |
2,50 ₸ |
10,00 ₸ |
1,25 ₸ |
5,00 ₸ |
|
YandexGPT Pro 5.1 |
2,00 ₸ 1 |
2,00 ₸ 1 |
1,00 ₸ 1 |
1,00 ₸ 1 |
|
YandexGPT Pro 5 или младше |
6,00 ₸ |
6,00 ₸ |
3,00 ₸ |
3,00 ₸ |
|
YandexGPT Lite |
1,00 ₸ |
1,00 ₸ |
0,50 ₸ |
0,50 ₸ |
|
Qwen3 235B |
2,50 ₸ 1 |
2,50 ₸ 1 |
— |
— |
|
gpt-oss-120b |
1,50 ₸ |
1,50 ₸ |
— |
— |
|
gpt-oss-20b |
0,50 ₸ |
0,50 ₸ |
— |
— |
|
Gemma3 27B |
2,00 ₸ 1 |
2,00 ₸ 1 |
— |
— |
1 Цена указана с учетом действующей скидки 50%.
Пример расчета стоимости работы модели в синхронном режиме
Параметры запроса:
- Инструкция: «Проанализируй предоставленный текст и выполни его комплексную грамотную редактуру. Твоя задача — устранить любые грамматические, орфографические, стилистические и пунктуационные ошибки, не изменяя при этом исходного смысла и структуры высказывания. Сохраняй оригинальный порядок слов и не вноси дополнительных уточнений, пояснений или переформулировок, которые могут изменить тон или содержание текста. Внесённые правки должны быть минимально необходимыми для того, чтобы предложение стало корректным с точки зрения русского языка. Также убедись, что все слова употреблены в нормативной форме, а знаки препинания соответствуют литературным стандартам»
- Текст запроса: «Нейрасети оптемезируют бизнес-працесы розгружают техпадержку ускаряют праверку документов аналис и абработку данных генирируют отчёты за минуты и прогназируют спрос.»
- Ответ модели: «Нейросети оптимизируют бизнес‑процессы: разгружают техподдержку, ускоряют проверку документов, анализ и обработку данных, генерируют отчёты за минуты и прогнозируют спрос.»
Количество символов на вход: 782
|
Alice AI LLM |
YandexGPT Pro 5.1 |
Qwen3 235B |
|
|
Токенов в запросе |
164 |
164 |
248 |
|
Токенов в ответе |
22 |
22 |
39 |
|
Стоимость запроса |
0,082 ₽ |
0,0656 ₽ |
0,124 ₽ |
|
Стоимость ответа |
0,044 ₽ |
0,0088 ₽ |
0,0195 ₽ |
|
Итого |
0,126 ₽ |
0,0744 ₽ |
0,1435 ₽ |
|
Alice AI LLM |
YandexGPT Pro 5.1 |
Qwen3 235B |
|
|
Токенов в запросе |
164 |
164 |
248 |
|
Токенов в ответе |
22 |
22 |
39 |
|
Стоимость запроса |
0,41 ₸ |
0,328 ₸ |
0,62 ₸ |
|
Стоимость ответа |
0,22 ₸ |
0,044 ₸ |
0,0975 ₸ |
|
Итого |
0,63 ₸ |
0,372 ₸ |
0,7175 ₸ |
Пример расчета стоимости работы модели в асинхронном режиме
Параметры запроса:
- Количество токенов в промпте — 115.
- Количество токенов в ответе — 1500.
- Модель YandexGPT Pro.
- Асинхронный режим работы модели.
- Количество токенов в промпте и ответе: 115 + 1500 = 1615.
- Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 0,60 ₽.
- Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
- Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.
Итого: (0,60 ₽ / 1000 токенов) × 1615 токенов = 0,969 ₽, округляя до целого значения, 0,97 ₽.
- Количество токенов в промпте и ответе: 115 + 1500 = 1615.
- Цена за 1000 токенов для модели YandexGPT Pro в асинхронном режиме: 3,00 ₸.
- Количество юнитов в 1 токене для модели YandexGPT Pro в асинхронном режиме: 3.
- Общее количество юнитов в детализации потребления: 1615 × 3 = 4845.
Итого: (3,00 ₸ / 1000 токенов) × 1615 токенов = 4,845 ₸, округляя до целого значения, 4,85 ₸.
Использования моделей в пакетном режиме
При использовании моделей в пакетном режиме минимальная стоимость запуска — 200 000 токенов.
|
Модель |
Цена за 1000 токеновв пакетном режиме,вкл. НДС |
|
Qwen2.5 7B Instruct |
0,10 ₽ |
|
Qwen2.5 72B Instruct |
0,60 ₽ |
|
QwQ 32B Instruct |
0,40 ₽ |
|
Llama-3.3-70B-Instruct |
0,60 ₽ |
|
Llama-3.1-70B-Instruct |
0,60 ₽ |
|
DeepSeek-R1-Distill-Llama-70B |
0,60 ₽ |
|
Qwen2.5 32B Instruct |
0,40 ₽ |
|
DeepSeek-R1-Distill-Qwen-32B |
0,40 ₽ |
|
phi-4 |
0,20 ₽ |
|
Qwen2 VL 7B |
0,10 ₽ |
|
Qwen2.5 VL 7B |
0,10 ₽ |
|
DeepSeek 2 VL |
0,40 ₽ |
|
DeepSeek 2 VL Tiny |
0,10 ₽ |
|
Gemma3 1B it |
0,10 ₽ |
|
Gemma3 4B it |
0,10 ₽ |
|
Gemma3 12B it |
0,20 ₽ |
|
Gemma3 27B it |
0,40 ₽ |
|
Qwen 2.5 VL 32B Instruct |
0,40 ₽ |
|
Qwen3-0.6B |
0,10 ₽ |
|
Qwen3-1.7B |
0,10 ₽ |
|
Qwen3-4B |
0,10 ₽ |
|
Qwen3-8B |
0,10 ₽ |
|
Qwen3-14B |
0,20 ₽ |
|
Qwen3-32B |
0,40 ₽ |
|
Qwen3-30B-A3B |
0,40 ₽ |
|
Qwen3-235B-A22B |
6,00 ₽ |
|
Модель |
Цена за 1000 токеновв пакетном режиме,вкл. НДС |
|
Qwen2.5 7B Instruct |
0,50 ₸ |
|
Qwen2.5 72B Instruct |
3,00 ₸ |
|
QwQ 32B Instruct |
2,00 ₸ |
|
Llama-3.3-70B-Instruct |
3,00 ₸ |
|
Llama-3.1-70B-Instruct |
3,00 ₸ |
|
DeepSeek-R1-Distill-Llama-70B |
3,00 ₸ |
|
Qwen2.5 32B Instruct |
2,00 ₸ |
|
DeepSeek-R1-Distill-Qwen-32B |
2,00 ₸ |
|
phi-4 |
1,00 ₸ |
|
Qwen2 VL 7B |
0,50 ₸ |
|
Qwen2.5 VL 7B |
0,50 ₸ |
|
DeepSeek 2 VL |
2,00 ₸ |
|
DeepSeek 2 VL Tiny |
0,50 ₸ |
|
Gemma3 1B it |
0,50 ₸ |
|
Gemma3 4B it |
0,50 ₸ |
|
Gemma3 12B it |
1,00 ₸ |
|
Gemma3 27B it |
2,00 ₸ |
|
Qwen 2.5 VL 32B Instruct |
2,00 ₸ |
|
Qwen3-0.6B |
0,50 ₸ |
|
Qwen3-1.7B |
0,50 ₸ |
|
Qwen3-4B |
0,50 ₸ |
|
Qwen3-8B |
0,50 ₸ |
|
Qwen3-14B |
1,00 ₸ |
|
Qwen3-32B |
2,00 ₸ |
|
Qwen3-30B-A3B |
2,00 ₸ |
|
Qwen3-235B-A22B |
30,00 ₸ |
Работы выделенных инстансов
Стоимость работы выделенного инстанса зависит от модели и выбранной конфигурации. Работа выделенного инстанса тарифицируется посекундно с округлением до юнита в большую сторону. При этом время обслуживания оборудования и развертывания модели не тарифицируется.
Цена указывается за 1 час использования. Тарификация посекундная.
Стоимость 1 юнита для выделенных инстансов равна 1,00 ₽ (вкл. НДС).
| Модель | Цена за 1 часконфигурация S, вкл. НДС |
Цена за 1 часконфигурация M, вкл. НДС |
Цена за 1 часконфигурация L, вкл. НДС |
|---|---|---|---|
| Qwen 2.5 VL 32B Instruct | 804,00 ₽ | 1 608,00 ₽ | 2 412,00 ₽ |
| Qwen 2.5 72B Instruct | 804,00 ₽ | 1 608,00 ₽ | 2 412,00 ₽ |
| Gemma 3 4B it | 402,00 ₽ | 804,00 ₽ | 1 206,00 ₽ |
| Gemma 3 12B it | 402,00 ₽ | 804,00 ₽ | 1 206,00 ₽ |
| T-pro-it-2.0-FP8 | 744,00 ₽ | 1 488,00 ₽ | 2 232,00 ₽ |
Стоимость 1 юнита для выделенных инстансов равна 5,00 ₸ (вкл. НДС).
| Модель | Цена за 1 часконфигурация S, вкл. НДС |
Цена за 1 часконфигурация M, вкл. НДС |
Цена за 1 часконфигурация L, вкл. НДС |
|---|---|---|---|
| Qwen 2.5 VL 32B Instruct | 4 020,00 ₸ | 8 040,00 ₸ | 12 060,00 ₸ |
| Qwen 2.5 72B Instruct | 4 020,00 ₸ | 8 040,00 ₸ | 12 060,00 ₸ |
| Gemma 3 4B it | 2 010,00 ₸ | 4 020,00 ₸ | 6 030,00 ₸ |
| Gemma 3 12B it | 2 010,00 ₸ | 4 020,00 ₸ | 6 030,00 ₸ |
| T-pro-it-2.0-FP8 | 3 720,00 ₸ | 7 440,00 ₸ | 11 160,00 ₸ |
Дообучение модели
На стадии Preview процесс дообучения моделей не тарифицируется. Дообученная модель YandexGPT Lite тарифицируется как базовая модель YandexGPT Lite.
Токенизация текста
Использование токенизатора (вызовы TokenizerService и методы Tokenizer) не тарифицируются.
Векторизация текста
Стоимость представления текста в виде векторов (получения эмбеддингов по тексту) зависит от объема текста, поданного на векторизацию. Создание эмбеддингов детализируется в Yandex Cloud Billing в юнитах векторизации.
| Количество | Цена, вкл. НДС |
|---|---|
| 1000 юнитов | 0,01 ₽ |
| Количество | Цена, вкл. НДС |
|---|---|
| 1000 юнитов | 0,05 ₸ |
| Параметры модели | Количество юнитовв 1 токене | Итоговая стоимость за обработку 1000 токенов, вкл. НДС |
|---|---|---|
| Получение эмбеддингов текста | 1 | 0,01 ₽ |
| Параметры модели | Количество юнитовв 1 токене | Стоимость за обработку 1000 токенов, вкл. НДС |
|---|---|---|
| Получение эмбеддингов текста | 1 | 0,05 ₸ |
Расчет стоимости векторизации текста
Стоимость векторизации текста в 2000 токенов составит:
- 0,01 ₽ — стоимость обработки 1000 токенов.
- 0,01 ₽ / 1000 — стоимость обработки 1 токена.
2000 × (0,01 ₽ / 1000) = 0,02 ₽
Итого: 0,02 ₽.
- 0,05 ₸ — стоимость обработки 1000 токенов.
- 0,05 ₸ / 1000 — стоимость обработки 1 токена.
2000 × (0,05 ₸ / 1000) = 0,10 ₸
Итого: 0,10 ₸.
Классификации текста
Стоимость классификации текста зависит от используемой модели классификации и количества переданных токенов.
- При классификации с помощью YandexGPT Lite единицей тарификации является 1 запрос до 1 000 токенов.
- При классификациях с помощью YandexGPT Pro и дообученных классификаторов единицей тарификации является 1 запрос до 250 токенов.
Запросы, содержащие тексты меньше единицы тарификации, округляются в большую сторону до ближайшего целого. Тексты большего объема тарифицируются как несколько запросов с округлением в большую сторону.
Например, классификация текста длиной 770 токенов с помощью YandexGPT Lite будет тарифицироваться как один запрос (одна единица тарификации).
Тот же самый текст длиной 770 токенов при классификации с помощью YandexGPT Pro или дообученного классификатора будет тарифицироваться как четыре запроса.
| Услуга | Цена, вкл. НДС |
|---|---|
| 1 запрос (1 000 токенов) на классификацию с помощью YandexGPT Lite | 0,15 ₽ |
| 1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro | 0,15 ₽ |
| 1 запрос (250 токенов) к дообученному классификатору | 0,15 ₽ |
| Услуга | Цена, вкл. НДС |
|---|---|
| 1 запрос (1 000 токенов) на классификацию с помощью YandexGPT Lite | 0,75 ₸ |
| 1 запрос (250 токенов) на классификацию с помощью YandexGPT Pro | 0,75 ₸ |
| 1 запрос (250 токенов) к дообученному классификатору | 0,75 ₸ |
Генерация изображений
Использование YandexART тарифицируется за каждый запрос на генерацию. При этом запросы не идемпотентны, поэтому два запроса с идентичными параметрами и промптом генерации считаются двумя самостоятельными запросами.
| Услуга | Цена, вкл. НДС |
|---|---|
| 1 запрос на генерацию изображения с помощью YandexART | 2,20 ₽ |
| Услуга | Цена, вкл. НДС |
|---|---|
| 1 запрос на генерацию изображения с помощью YandexART | 11,00 ₸ |
Agent Atelier
Использование ассистентов и текстовых агентов
Использование AI Assistant API, Responses API и хранение файлов и поисковых индексов не тарифицируется. Потребленные токены оплачиваются по правилам и тарифам моделей Model Gallery.
Использование голосовых агентов
Стоимость использования голосовых агентов состоит из стоимости распознавания речи (входящее аудио), стоимости синтеза речи (исходящее аудио) и стоимости генерации текста с помощью модели speech-realtime-250923.
| Услуга | Цена за единицу тарификации, вкл. НДС |
|---|---|
| Входящее аудио, за 1 секунду | 0,0260 ₽ |
| Исходящее аудио, за 1 секунду | 0,02 ₽ |
| Генерация текста, за 1000 токенов | 0,80 ₽ |
| Услуга | Цена за единицу тарификации, вкл. НДС |
|---|---|
| Входящее аудио, за 1 секунду | 0,13 ₸ |
| Исходящее аудио, за 1 секунду | 0,10 ₸ |
| Генерация текста, за 1000 токенов | 4,00 ₸ 1 |
Расчет стоимости использования голосового агента
Стоимость использования голосового агента за сессию общей длительностью 60 секунд, в которой:
- Входящее аудио — 60 секунд.
- Исходящее аудио — 20 секунд.
- Число сгенерированных токенов — 2000.
0,80 ₽ × 2 + 0,026 ₽ × 60 + 0,02 ₽ × 20 = 1,60 ₽ + 1,56 ₽ + 0,40 ₽
Итого: 3,56 ₽.
Где:
- 0,80 ₽ — стоимость обработки 1000 токенов.
- 0,80 ₽ × 2 — стоимость обработки 2000 токенов.
- 0,0260 ₽ — стоимость обработки 1 секунды входящего аудио.
- 0,0260 ₽ × 60 — стоимость обработки 60 секунд входящего аудио.
- 0,02 ₽ — стоимость обработки 1 секунды исходящего аудио.
- 0,02 ₽ × 20 — стоимость обработки 20 секунд исходящего аудио.
4,00 ₸ × 2 + 0,13 ₸ × 60 + 0,10 ₸ × 20 = 8,00 ₸ + 7,80 ₸ + 2,00 ₸
Итого: 17,80 ₸.
Где:
- 4,00 ₸ — стоимость обработки 1000 токенов.
- 4,00 ₸ × 2 — стоимость обработки 2000 токенов.
- 0,13 ₸ — стоимость обработки 1 секунды входящего аудио.
- 0,13 ₸ × 60 — стоимость обработки 60 секунд входящего аудио.
- 0,10 ₸ — стоимость обработки 1 секунды исходящего аудио.
- 0,10 ₸ × 20 — стоимость обработки 20 секунд исходящего аудио.
Использование инструментов в агентах
Вызов инструментов AI Assistant API не тарифицируется.
Вызов инструмента поиска по файлам File Search в текстовых и голосовых агентах не тарифицируется.
Вызов инструмента поиска в интернете Web Search в текстовых и голосовых агентах не тарифицируется до 17 ноября 2025 года.
| Услуга | Цена за 1000 запросов, вкл. НДС |
|---|---|
| Инструмент поиска в интернете | 900,00 ₽ |
| Услуга | Цена за 1000 запросов, вкл. НДС |
|---|---|
| Инструмент поиска в интернете | 4500,00 ₸ |
MCP Hub
Примечание
Функциональность находится на стадии Preview.
На стадии Preview MCP-серверы не тарифицируются. При этом может оплачиваться использование инструментов, создаваемых в MCP-серверах. Например, вызовы функций Yandex Cloud Functions.
При работе с внешними API, такими как Контур.Фокус или amoCRM, оплата использования производится партнеру напрямую.
Внутренние ошибки сервера
Если в процессе выполнения запроса произошла внутренняя ошибка сервера, запрос не тарифицируется.