Дообучение моделей
Yandex Foundation Models позволяет дообучать по методу LoRA
Дообучение моделей в Yandex Foundation Models находится на стадии Preview.
Возможности дообучения моделей генерации текста
Модели генерации текста не получится дообучить новой информации, например базе знаний службы поддержки. Однако вы можете обучить модель отдавать ответ в определенном формате или анализировать текст. Так, модель можно обучить:
- пересказывать и изменять формулировки текстов;
- генерировать вопросы к тексту и ответы на них;
- форматировать ответы в определенной стилистике или формате;
- классифицировать тексты, обращения и диалоги;
- извлекать сущности из текста.
Процесс дообучения в Foundation Models
Требования к данным для дообучения см. в разделах Датасеты для генерации текста и Датасеты для классификации текста.
Подготовленные данные необходимо загрузить в Yandex Cloud в виде датасета. По умолчанию вы можете загрузить до 5 ГБ данных для дообучения в один датасет. Со всеми ограничениями вы можете ознакомиться в разделе Квоты и лимиты в Yandex Foundation Models.
После загрузки датасета запустите дообучение, указав его тип и, опционально, задав параметры. Дообучение займет от 1 часа до 1 суток в зависимости от объема данных и загруженности системы.
Пример дообучения модели см. в разделе Дообучить модель генерации текста.
Для дообучения моделей в Foundation Models вам понадобится роль ai.editor
. Она позволит загрузить данные и запустить дообучение.
Запросы к дообученным моделям
После завершения обучения вы получите идентификатор дообученной модели. Этот идентификатор нужно передавать в поле modelUri
тела запроса. Обращаться к дообученной модели генерации текста можно через API генерации текста, AI Assistant API, из Yandex DataSphere и других приложений. Чтобы отправить запрос дообученному классификатору, используйте метод classify Text Classification API. Вы также можете использовать Yandex Cloud ML SDK для работы с дообученными моделями.
Примечание
Для корректной работы дообученной модели указывайте инструкцию, использованную при обучении, в сообщении с ролью отправителя system
.
Чтобы отправлять запросы через API в ноутбуках DataSphereai.languageModels.user
.
Примеры
- Дообучить модель генерации текста.
- Дообучить модель классификации текста
- Дообучение моделей в DataSphere
1 Llama создана компанией Meta. Meta признана экстремистской организацией, ее деятельность в России запрещена.