Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Истории успеха
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Доступны в регионе
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • ИИ для бизнеса
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Партнёрская программа
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Истории успеха
  • Документация
  • Блог
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»
Yandex AI Studio
  • Начало работы с Model Gallery
    • О сервисе Yandex AI Studio
      • Обзор
      • Модели базового инстанса
      • Модели выделенного инстанса
      • Пакетная обработка данных
      • Вызов функций
      • Режим рассуждений
      • Форматирование ответов моделей
      • Эмбеддинги
      • Датасеты
      • Дообучение
      • Токены
    • Yandex Workflows
    • Квоты и лимиты
    • Термины и определения
  • Переход с AI Assistant API на Responses API
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Аудитные логи Audit Trails
  • Публичные материалы
  • История изменений

В этой статье:

  • Возможности дообучения моделей генерации текста
  • Процесс дообучения в AI Studio
  • Запросы к дообученным моделям
  • Примеры использования
  1. Концепции
  2. Model Gallery
  3. Дообучение

Дообучение моделей

Статья создана
Yandex Cloud
Обновлена 2 октября 2025 г.
  • Возможности дообучения моделей генерации текста
  • Процесс дообучения в AI Studio
  • Запросы к дообученным моделям
  • Примеры использования

Yandex AI Studio позволяет дообучать по методу LoRA (Low-Rank Adaptation of Large Language Models) модель генерации текста YandexGPT Lite, классификаторы на базе YandexGPT Lite и модель эмбеддингов.

Дообучение моделей в Yandex AI Studio находится на стадии Preview.

Возможности дообучения моделей генерации текстаВозможности дообучения моделей генерации текста

Модели генерации текста не получится дообучить новой информации, например базе знаний службы поддержки. Однако вы можете обучить модель отдавать ответ в определенном формате или анализировать текст. Так, модель можно обучить:

  • пересказывать и изменять формулировки текстов;
  • генерировать вопросы к тексту и ответы на них;
  • форматировать ответы в определенной стилистике или формате;
  • классифицировать тексты, обращения и диалоги;
  • извлекать сущности из текста;
  • дообучать модели классификации и эмбедингов.

Процесс дообучения в AI StudioПроцесс дообучения в AI Studio

Требования к данным для дообучения см. в разделах Датасеты для генерации текста, Датасеты для классификации текста и Датасеты для эмбеддингов.

Подготовленные данные необходимо загрузить в Yandex Cloud в виде датасета. По умолчанию вы можете загрузить до 5 ГБ данных для дообучения в один датасет. Со всеми ограничениями вы можете ознакомиться в разделе Квоты и лимиты в Yandex AI Studio.

После загрузки датасета запустите дообучение, указав его тип и, опционально, задав параметры. Дообучение займет от 1 часа до 1 суток в зависимости от объема данных и загруженности системы.

Примеры дообучения моделей доступны в разделах Дообучить модель генерации текста, Дообучить модель классификации текста и Дообучить модель эмбеддингов.

Для дообучения моделей в AI Studio вам понадобится роль ai.editor. Она позволит загрузить данные и запустить дообучение.

Запросы к дообученным моделямЗапросы к дообученным моделям

После завершения обучения вы получите идентификатор дообученной модели. Этот идентификатор нужно передавать в поле modelUri тела запроса. Обращаться к дообученной модели генерации текста можно через API генерации текста, AI Assistant API, из Yandex DataSphere и других приложений. Чтобы отправить запрос дообученному классификатору, используйте метод classify Text Classification API. Вы также можете использовать Yandex Cloud ML SDK для работы с дообученными моделями.

Примечание

Для корректной работы дообученной модели указывайте инструкцию, использованную при обучении, в сообщении с ролью отправителя system.

Чтобы отправлять запросы через API в ноутбуках DataSphere, добавьте пользовательский или сервисный аккаунт, от имени которого будут выполняться запросы, в список участников проекта DataSphere. Аккаунт должен иметь роль ai.languageModels.user.

Примеры использованияПримеры использования

  • Дообучить модель генерации текста
  • Дообучить модель классификации текста
  • Дообучение моделей в DataSphere Notebooks
  • Создать датасет для дообучения модели генерации текста
  • Создать датасет для дообучения модели классификации текста

Была ли статья полезна?

Предыдущая
Датасеты
Следующая
Токены
Проект Яндекса
© 2025 ТОО «Облачные Сервисы Казахстан»