Yandex Cloud
Поиск
Связаться с намиПодключиться
  • Документация
  • Блог
  • Все сервисы
  • Статус работы сервисов
    • Популярные
    • Инфраструктура и сеть
    • Платформа данных
    • Контейнеры
    • Инструменты разработчика
    • Бессерверные вычисления
    • Безопасность
    • Мониторинг и управление ресурсами
    • Машинное обучение
    • Бизнес-инструменты
  • Все решения
    • По отраслям
    • По типу задач
    • Экономика платформы
    • Безопасность
    • Техническая поддержка
    • Каталог партнёров
    • Обучение и сертификация
    • Облако для стартапов
    • Облако для крупного бизнеса
    • Центр технологий для общества
    • Облако для интеграторов
    • Поддержка IT-бизнеса
    • Облако для фрилансеров
    • Обучение и сертификация
    • Блог
    • Документация
    • Контент-программа
    • Мероприятия и вебинары
    • Контакты, чаты и сообщества
    • Идеи
    • Истории успеха
    • Тарифы Yandex Cloud
    • Промоакции и free tier
    • Правила тарификации
  • Документация
  • Блог
Проект Яндекса
© 2025 ООО «Яндекс.Облако»
Yandex Foundation Models
  • Yandex Cloud ML SDK
  • Совместимость с OpenAI
    • Обзор
    • Рекомендации по использованию YandexGPT
  • Управление доступом
  • Правила тарификации
  • Публичные материалы
  • История изменений

В этой статье:

  • Разделение сложных задач
  • Приведение ответа к конкретным форматам
  • Указание длины выходного текста
  • Использование классификаторов для улучшения алгоритма
  • Дообучение модели
  1. Как создавать промты
  2. Рекомендации по использованию YandexGPT

Рекомендации по использованию YandexGPT

Статья создана
Yandex Cloud
Обновлена 9 декабря 2024 г.
  • Разделение сложных задач
  • Приведение ответа к конкретным форматам
  • Указание длины выходного текста
  • Использование классификаторов для улучшения алгоритма
  • Дообучение модели

Модель YandexGPT позволяет эффективно решать различные задачи, связанные с обработкой текстов. В этом разделе приведены некоторые рекомендации, которые помогут вам максимально эффективно использовать возможности YandexGPT.

Разделение сложных задачРазделение сложных задач

Сложные задачи лучше разбивать на несколько простых, если это позволяет допустимое время обработки запроса и бюджет.

Например, вы решаете задачу переписывания неформального текста в более формальный. Ваше понимание «формального текста» и понимание модели отличаются. Чтобы получать текст в ожидаемом виде, вы передаете в промт длинный список критериев того, что такое «формальный текст». С увеличением критериев модель будет придавать все меньше значимости каждому из них, и точность результатов будет падать.

Однако как большинство задач реального мира, так и вашу текущую тоже, можно разложить на несколько простых:

  1. Продумайте последовательные шаги решения вашей задачи.
  2. Составьте промты для каждого шага.
  3. Отправляйте их в модель последовательно.

Например, вы можете составить шесть критериев формального текста, трансформировать текст с вниманием к первым трем критериям, а затем повторить операцию с вниманием к оставшимся. Чем короче и лаконичнее промт, тем выше точность работы модели и меньше различий в ответах на похожие запросы.

Приведение ответа к конкретным форматамПриведение ответа к конкретным форматам

Если вам нужна высокая стабильность генерации текста в определенном формате, вы можете вынести переформатирование текста в дополнительный шаг. Например, если вам нужно преобразовать текст из Markdown, можно действовать следующим образом:

  1. Сначала переписать ответ модели еще раз.

    Перепиши json ниже в правильный формат, если есть ошибки (например использование ```json или ``` — это нужно удалить). Не выводи ничего лишнего.
    
  2. Очистить текст от артефактов программными методами.
    Например, следующий скрипт на Python использует библиотеку markdown2 и регулярное выражение для постобработки ответа YandexGPT:

    import markdown2
    import re
    
    markdown_text = """
    # Заголовок
    **Жирный текст**
    *Курсивный текст*
    [Ссылка](http://example.com)
    ![Изображение](http://example.com/image.jpg)
    `Код`
    - Список
    """
    html = markdown2.markdown(markdown_text)
    plain_text = re.sub(r'<[^>]+>', '', html)  # Удаление HTML-тегов
    print(plain_text)
    

Указание длины выходного текстаУказание длины выходного текста

Для задания длины выходного текста укажите примерную длину ответа в промте. Например:

"Перепиши текст так, чтобы он был длиной около 1000 символов."

Также вы можете ограничить длину текста в токенах. Для этого укажите параметр max_tokens в запросе к YandexGPT.

Использование классификаторов для улучшения алгоритмаИспользование классификаторов для улучшения алгоритма

Если вам нужно добавить логику обработки запроса, похожую на маршрутизацию или отделение "правильных" запросов от "плохих", в этом случае можно использовать классификатор на базе YandexGPT. Вы можете применять его на любом участке работы вашего алгоритма обработки запроса.

Дообучение моделиДообучение модели

Для повышения точности работы в некоторых задачах можно дообучить модель под конкретную задачу. Для этого вам будут необходимы данные. Вы можете создать их с помощью писателей, найти в готовые в интернете, создать синтетически или собрать с пользователей в процессе их взаимодействия с вашим сервисом.

Так, модель можно обучить:

  • пересказывать и изменять формулировки текстов;
  • генерировать вопросы к тексту и ответы на них;
  • форматировать ответы в определенной стилистике или формате;
  • классифицировать тексты, обращения и диалоги;
  • извлекать сущности из текста.

Дообучение не поможет или несущественно увеличит точность результатов, если вы хотите:

  • заложить в модель новые знания;
  • улучшить или изменить знания модели;
  • заложить в модель новую доменную область;
  • заложить в модель понимание новых терминов;
  • научить модель анализировать сложные технические данные.

Дообучение YandexGPT изменяет только последний слой модели. О том, как дообучить модель, см. руководство Дообучение моделей.

Была ли статья полезна?

Предыдущая
Обзор
Следующая
Параметры LLM
Проект Яндекса
© 2025 ООО «Яндекс.Облако»