Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Foundation Models
    • О сервисе Yandex Foundation Models
    • Мультимодальные модели
    • Эмбеддинги
    • Датасеты
    • Дообучение
    • Квоты и лимиты
  • Yandex Cloud ML SDK
  • Совместимость с OpenAI
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений

В этой статье:

  • Возможности дообучения моделей генерации текста
  • Процесс дообучения в Foundation Models
  • Запросы к дообученным моделям
  • Примеры использования
  1. Концепции
  2. Дообучение

Дообучение моделей

Статья создана
Yandex Cloud
Улучшена
Tania L.
Обновлена 30 апреля 2025 г.
  • Возможности дообучения моделей генерации текста
  • Процесс дообучения в Foundation Models
  • Запросы к дообученным моделям
  • Примеры использования

Yandex Foundation Models позволяет дообучать по методу LoRA (Low-Rank Adaptation of Large Language Models) модели генерации текста YandexGPT Lite и Llama 8B1, а также классификаторы на базе YandexGPT Lite.

Дообучение моделей в Yandex Foundation Models находится на стадии Preview.

Возможности дообучения моделей генерации текстаВозможности дообучения моделей генерации текста

Модели генерации текста не получится дообучить новой информации, например базе знаний службы поддержки. Однако вы можете обучить модель отдавать ответ в определенном формате или анализировать текст. Так, модель можно обучить:

  • пересказывать и изменять формулировки текстов;
  • генерировать вопросы к тексту и ответы на них;
  • форматировать ответы в определенной стилистике или формате;
  • классифицировать тексты, обращения и диалоги;
  • извлекать сущности из текста.

Процесс дообучения в Foundation ModelsПроцесс дообучения в Foundation Models

Требования к данным для дообучения см. в разделах Датасеты для генерации текста и Датасеты для классификации текста.

Подготовленные данные необходимо загрузить в Yandex Cloud в виде датасета. По умолчанию вы можете загрузить до 5 ГБ данных для дообучения в один датасет. Со всеми ограничениями вы можете ознакомиться в разделе Квоты и лимиты в Yandex Foundation Models.

После загрузки датасета запустите дообучение, указав его тип и, опционально, задав параметры. Дообучение займет от 1 часа до 1 суток в зависимости от объема данных и загруженности системы.

Пример дообучения модели см. в разделе Дообучить модель генерации текста.

Для дообучения моделей в Foundation Models вам понадобится роль ai.editor. Она позволит загрузить данные и запустить дообучение.

Запросы к дообученным моделямЗапросы к дообученным моделям

После завершения обучения вы получите идентификатор дообученной модели. Этот идентификатор нужно передавать в поле modelUri тела запроса. Обращаться к дообученной модели генерации текста можно через API генерации текста, AI Assistant API, из Yandex DataSphere и других приложений. Чтобы отправить запрос дообученному классификатору, используйте метод classify Text Classification API. Вы также можете использовать Yandex Cloud ML SDK для работы с дообученными моделями.

Примечание

Для корректной работы дообученной модели указывайте инструкцию, использованную при обучении, в сообщении с ролью отправителя system.

Чтобы отправлять запросы через API в ноутбуках DataSphere, добавьте пользовательский или сервисный аккаунт, от имени которого будут выполняться запросы, в список участников проекта DataSphere. Аккаунт должен иметь роль ai.languageModels.user.

Примеры использованияПримеры использования

  • Дообучить модель генерации текста
  • Дообучить модель классификации текста
  • Дообучение моделей в DataSphere

1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.

Была ли статья полезна?

Предыдущая
Датасеты
Следующая
Обзор
Проект Яндекса
© 2025 ООО «Яндекс.Облако»