Neurosupport

Статья создана

Обновлена 3 марта 2026 г.

О сервисе
Получение доступа
Интеграция
Рекомендации по улучшению качества ответов

О сервисе

Yandex Neurosupport — сервис для подсказок и автоответов на основе базы знаний, специализированный под домен технической поддержки. Выдает рекомендации в реальном времени и естественной языковой манере. Может использоваться для формирования подсказок оператору поддержки, для автоматических ответов клиентам и в качестве внутреннего помощника для сотрудников.

Neurosupport генерирует рекомендацию, как ответить на диалог или запрос, используя:

текущую реплику клиента или историю диалога с ним;
метаданные о контексте ситуации;
релевантные статьи и инструкции из базы знаний.

Получение доступа

Для получения доступа необходимо быть зарегистрированным в Облаке.

Запрос на предоставление доступа подается через форму с указанием ID Облака.

Для начала использования требуется:

Получить ID Облака.
При необходимости cоздать каталог. По умолчанию уже создан каталог с названием default.
Создать сервисный аккаунт для выбранного каталога и выдать роли — editor и search-api.webSearch.user по инструкции.
Получить токен для запросов в API, для этого:
1. Установить консольную утилиту yc.
2. Выполнить в консоли команду yc init, указав необходимые идентификаторы.
Получить IAM-токен по инструкции.

Внимание

Время жизни IAM-токена — не больше 12 часов, но рекомендуется запрашивать его чаще, например каждый час.

Проверить доступ к API. Адрес: https://supportgpt.api.cloud.yandex.net.

Пример запроса (с генерацией токена):

IAM_TOKEN=$(yc iam create-token)
FOLDER_ID="${1:-<ваш folder ID>}"
curl -H "Authorization: Bearer ${IAM_TOKEN}" -H "x-folder-id: ${FOLDER_ID}" -X GET https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes

Убедиться, что по итогам обработки запроса вам передали параметры для обращения к API:
- сервис (service);
- продукт (product);
- префикс для создания индексов.

При возникновении вопросов добавляйтесь в чат технической поддержки.

Интеграция

Neurosupport работает только по API. Логику вызовов API, конкретный состав передаваемых данных, логику использования результата вам требуется определить на своей стороне, в частности:

По запросу подсказки:
- запрашивать всегда или по событию (действию пользователя);
- по каким диалогам запрашивать;
- в какой момент запрашивать;
- какую часть диалога / данных к диалогам передавать;
- по каким документам разрешать отвечать сервису.
По отображению подсказки на своей стороне:
- где в UI показывать подсказку;
- показывать только подсказку или в дополнение ссылки на документы, по которым она сгенерировалась;
- показывать подсказку как рекомендацию, которую можно опционально применить, или сразу вставлять полученный текст в блок ответа (его можно отредактировать перед отправкой).

Архитектура интеграции

Основные интеграционные потоки:

Первичная загрузка базы знаний.
Периодическое обновление базы знаний.
Передача информации для запроса подсказки (метаданные и диалог), получение ответа.

Описание структуры API

Примечание

Готовый набор запросов к API доступен на GitHub.

Documents Post

Создание индекса или обновление существующего.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/documents

Метод: POST.

index_name — Строковое имя индекса (строка, обязательное). Для формирования index_name используйте полученный ранее префикс, значение должно начинаться с него. Подробнее см. раздел Загрузка базы знаний.

Схема запроса (Request Body schema: application/json):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
meta — Метаинформация об индексе (опциональное).
auto_switch — Нужно ли сразу переключиться на новый индекс после добавления данных. При установке false для переключения есть отдельный запрос. При создании нового индекса, данные старого индекса на какое-то время остаются в базе (логическое значение, опциональное).
index_version — Опциональное поле для указания версии индекса (число, опциональное). В случае отсутствия версия будет определена автоматически. Если указать ранее загруженную версию, на которую еще не было переключения, документы будут добавлены к этой версии. Для добавления документов в активную версию, на которую уже было переключение, используйте флаг diff.
documents — Список документов для индексации (обязательное). Обратите внимание, что большие документы при загрузке разбиваются на части меньшего размера. Идентификатор каждой такой части будет (идентификатор документа)_(номер части). Например, объемный документ с "doc_id": "instructions" будет загружен частями с идентификаторами "doc_id": "instructions_0", "instructions_1" и т.д. (обязательное):
- doc_id — Id документа, длина не более 255 символов (строка, обязательное).
- title — Заголовок документа (строка, обязательное).
- text — Текст документа (строка, обязательное).
- meta — Дополнительные метаданные документа, заносятся в индекс в виде пар key-value в свободном формате (опциональное).
- typed_meta — значения метаданных для гибкой фильтрации (опциональное, подробнее см. раздел Гибкая фильтрация по метаданным):
  - params — Метапараметры документов, могут быть использованы в запросах (опциональное):
    - name — Название параметра (строка, обязательное).
    - param_type — Тип параметра (строка, опциональное).
    - value — Значение параметра (опциональное).
diff — Если true, то индекс будет создан на основе существующего, с добавкой переданных документов. При совпадении id документов информация будет заменена (логическое значение, опциональное).

Схема ответа:

index_name — Строковое имя индекса (строка, обязательное).
index_version — Версия индекса, который был обновлен (строка, обязательное).
index_parent_version — Если был выставлен флаг diff, то в этом поле будет версия родительского индекса, на основе которого был создан новый индекс (строка, опциональное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
  "meta": {
    "source": "исходный источник данных, зависит от клиента",
    "description": "описание индекса"
  },
  "auto_switch": true,
  "index_version": 1,
  "documents": [
    {
      "doc_id": "doc42",
      "title": "Инструкция по решению такой-то технической проблемы",
      "text": "Чтобы решить такую-то техническую проблему, надо предпринять такие-то действия",
      "meta": {
        "title": "заголовок документа",
        "source_id": "исходный источник документа такой-то",
        "some_another_key": "some_another_value"
      },
      "typed_meta": {
        "params": [
          {
            "name": "entity",
            "param_type": "bool",
            "value": "book"
          }
        ]
      }
    }
  ],
  "diff": false
}

Пример ответа:

{
  "index_name": "your_index_name",
  "index_version": 3,
  "index_parent_version": 2
}

Get Index Info

Получение информации об индексе.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}

Метод: GET.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Query params):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
index_version — Версия индекса. По умолчанию текущая версия индекса, но основе которой делаются генеративные ответы (строка, опциональное).

Схема ответа:

index_name — Строковое имя индекса (строка, обязательное).
index_version — Версия индекса (строка, обязательное).
index_parent_version — Родительская версия индекса (строка, опциональное).
doc_count — Общее количество документов в индексе (число, обязательное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
  "index_version": 3
}

Пример ответа:

{
  "index_name": "your_index_name",
  "index_version": 3,
  "index_parent_version": 2,
  "doc_count": 100
}

Get Indexes List

Получение имен и метаданных всех индексов, на которые у пользователя есть права.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes

Метод: GET.

Схема запроса (Query params):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
page — Номер страницы для постраничной загрузки (число, опциональное).
size — Количество записей на странице (число, опциональное).

Схема ответа:

indexes — Список общих данных об индексах, на которые у пользователя есть права (обязательное):
- index_id — Числовой идентификатор индекса (число, обязательное).
- name — Строковое имя индекса (строка, обязательное).
- current_version — Текущая версия индекса, но основе которой делаются генеративные ответы (число, опциональное).
- doc_count — Общее количество документов в индексе (число, опциональное).
indexes_count — Общее количество индексов, удовлетворяющих условиям фильтрации (число, обязательное).
pages_count — Общее количество страниц в пагинации (число, обязательное).

Пример ответа:

{
  "indexes": [
    {
      "index_id": 42,
      "name": "your_index_name",
      "current_version": 3,
      "doc_count": 1000
    }
  ],
  "indexes_count": 0,
  "pages_count": 0
}

Get Index Documents

Получение документов из индекса.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/documents

Метод: GET.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Query params):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
index_version — Версия индекса. В случае отсутствия будет использована текущая версия (число, опциональное).
after_id — Для пагинации при сортировке по id документа: вернуть документы, у которых id больше заданного (строка, опциональное).
search_query — Поисковой запрос по прямому вхождению текста (строка, опциональное).
document_id — Получить один документ по заданному id (строка, опциональное).
limit — Максимальное количество документов на запрос. Для получения следующей группы документов можно использовать after_id (число, опциональное).
sort_by — Поле для сортировки (строка, опциональное).
sort_order — Порядок сортировки: asc или desc (строка, опциональное).

Схема ответа:

parameters — Общие параметры запроса и ответа (обязательное):
- items_total — Общее количество документов в индексе (число, обязательное).
- items_returned — Количество документов, которые были возвращены в этом запросе (число, обязательное).
- last_id — Идентификатор последнего документа, для использования в целях пагинации (строка, опциональное).
- after_id — Параметр из запроса (строка, опциональное).
- limit — Параметр из запроса (число, опциональное).
- sort_by — Параметр из запроса (строка, опциональное).
- sort_order — Параметр из запроса (строка, опциональное).
items — Документы из индекса (обязательное):
- doc_id — Id документа (строка, обязательное).
- title — Заголовок документа (строка, опциональное).
- text — Текст документа (строка, опциональное).
- meta — Дополнительные метаданные документа, заносятся в индекс в виде пар key-value в свободном формате (опциональное).

Пример ответа:

{
  "parameters": {
    "items_total": 100,
    "items_returned": 50,
    "last_id": "doc20",
    "after_id": "doc10",
    "limit": 10,
    "sort_by": "document_id",
    "sort_order": "asc"
  },
  "items": [
    {
      "doc_id": "doc42",
      "title": "Инструкция по решению такой-то технической проблемы",
      "text": "Чтобы решить такую-то техническую проблему, надо предпринять такие-то действия",
      "meta": {
        "title": "заголовок документа",
        "source_id": "исходный источник документа такой-то",
        "some_another_key": "some_another_value"
      }
    }
  ]
}

Switch Index Version

Переключение актуальной версии индекса.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/switch_version

Метод: POST.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Request Body schema: application/json):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
index_version — Версия индекса для переключения (число, обязательное).

Схема ответа:

index_name — Строковое имя индекса (строка, обязательное).
index_version — Версия индекса, на которую было переключение (число, обязательное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
  "index_version": 3
}

Пример ответа:

{
  "index_name": "your_index_name",
  "index_version": 3
}

Rename index

Переименование индекса.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/rename

Метод: POST.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Request Body schema: application/json):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
new_index_name — Новое строковое имя индекса. Новое имя должно начинаться с того же префикса, что и текущее (строка, обязательное).

Схема ответа:

index_name — Строковое имя индекса после переименования (строка, обязательное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
  "new_index_name": "new_index_name"
}

Пример ответа:

{
  "index_name": "new_index_name"
}

Delete Index Documents

Удаление документов из индекса.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/documents

Метод: DELETE.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Query params):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
docs_ids — Id документов, которые нужно удалить (обязательное).
index_version — Опционально: версия индекса. В случае отсутствия будет использована текущая версия (число, опциональное).
auto_switch — Нужно ли сразу переключиться на новый индекс после добавления данных. При установке false для переключения есть отдельный запрос (логическое значение, опциональное).

Схема ответа:

index_name — Строковое имя индекса (строка, обязательное).
index_version — Версия индекса, который был обновлен (строка, обязательное).
index_parent_version — Если был выставлен флаг diff, то в этом поле будет версия родительского индекса, на основе которого был создан новый индекс (строка, опциональное).

Пример ответа:

{
  "index_name": "your_index_name",
  "index_version": 3,
  "index_parent_version": 2
}

Delete Index

Удаление индекса и всех его версий.

https://supportgpt.api.cloud.yandex.net/indexer/v1/indexes/{index_name}/delete

Метод: DELETE.

index_name — Строковое имя индекса (строка, обязательное).

Схема запроса (Query params):

service — строковый идентификатор сервиса (строка, обязательное).
product — строковый идентификатор продукта (строка, обязательное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
}

Пример ответа:

Код 200 в случае успешного удаления индекса.

Answer Public

Получение генеративных ответов.

https://supportgpt.api.cloud.yandex.net/api/v1/answer

Метод: POST.

Схема запроса (Request Body schema: application/json):

service — Строковый идентификатор сервиса (строка, обязательное).
product — Строковый идентификатор продукта (строка, обязательное).
dialog — Диалог пользователя и оператора (обязательное):
- role — Тип сообщения (строка, обязательное).
- text — Текст сообщения (строка, обязательное).
- id — Идентификатор сообщения в свободном виде (число, опциональное).
- created — Дата и время создания сообщения в ISO-формате YYYY-mm-ddTHH:MM:SS (строка, опциональное).
meta_features — Дополнительные метаданные. Подробнее см. раздел Гибкая фильтрация по метаданным (опциональное).
index_name — Имя индекса, на основании которого нужно сгенерировать ответ. В случае отсутствия будет взято имя по умолчанию, которое зависит от service/product (строка, опциональное).
options — Дополнительные параметры процессинга (опциональное):
- filter_settings — Общие параметры для фильтрации документов (опциональное):
  - filter_by_meta — Параметры для фильтрации по метаданным документов (опциональное):
    - property name — Массив строк или чисел (опциональное).
  - document_ids — Id документов, среди которых будет выполняться поиск. Если список пустой, поиск будет по всем ids (массив строк, опциональное).
scoring — Провести скоринг сгенерированного ответа (логическое значение, опциональное).
candidates_top_k — Количество чанков, которые передаются в модель. Значение по умолчению 10 (опциональное).

Схема ответа:

answers — Список ответов модели (обязательное):
answer — Текст ответа (строка, обязательное).
meta — Дополнительные данные по ответу (объект, обязательное):
- rag_docs — Опционально: данные по релевантным документам из индекса (обязательное):
  - source_id — Id источника документа в базе клиента (число, опциональное).
- answer_annotations — Аннотации к ответам (обязательное):
  - label — Идентификатор аннотации (строка, обязательное).
  - title — Заголовок аннотации (строка, обязательное).
  - type — Тип аннотации. Сейчас только source_annotation (строка, обязательное).
  - text — Текст аннотации (строка, обязательное).
  - answer_position — Положение аннотации в тексте (объект, обязательное):
    - begin — Позиция начала фрагмента текста (число, обязательное).
    - end — Позиция конца фрагмента текста (число, обязательное).
  - url — Ссылка на источник (строка, опциональное).
- source_documents — Опционально: источники документов, из которых был выбран ответ (обязательное):
  - source_id — Id источника документа в базе клиента (строка, обязательное).
  - title — Заголовок документа (строка, опциональное).
- request_id — Идентификатор запроса x-request-id из хедера (строка, опциональное).
- scoring — Скоринг сгенерированного ответа (число, опциональное).

Пример запроса:

{
  "service": "your_service",
  "product": "your_product",
  "dialog": [
    {
      "role": "operator",
      "text": "Добрый день, чем я могу помочь?"
    },
    {
      "role": "client",
      "text": "Помогите решить такую-то техническую проблему"
    }
  ],
  "index_name": "your_index_name",
  "scoring": true
}

Пример ответа:

{
  "answers": [
    {
      "answer": "Чтобы решить техническую проблему по вашему вопросу, надо выполнить такие-то действия",
      "meta": {
        "rag_docs": [
          {
            "source_id": 42
          },
          {
            "source_id": 43
          }
        ],
        "answer_annotations": [
          {
            "label": "1",
            "title": "Например, имя документа",
            "type": "source_annotation",
            "text": "Фрагмент из инструкции, как сделать что-то",
            "answer_position": {
              "begin": 42,
              "end": 78
            },
            "url": "https://example.com"
          }
        ],
        "source_documents": [
          {
            "source_id": "12345daaeaee11efb64d2e8712812345_0",
            "title": "Название документа"
          }
        ],
        "request_id": "string",
        "scoring": 4
      }
    }
  ]
}

Рекомендации по использованию API

При использовании Neurosupport есть 2 ключевых шага:

загрузка базы знаний;
запрос генеративного ответа.

Загрузка базы знаний

Перед выгрузкой базы знаний проверьте ее на соответствие пункту Рекомендации по формату базы знаний. Соблюдение этих рекомендаций может существенно повысить качество получаемых генеративных ответов.

Для первичной загрузки документов базы знаний используйте метод Documents Post. Для формирования index_name используйте полученный ранее префикс, значение должно начинаться с него. Например, для префикса 10_company_ название индекса может быть:

10_company_archive
10_company_1
10_company_answers_and_recommendations

Пример запроса для метода Documents Post

{
  "service": "your_service",
  "product": "your_product",
  "meta": {
    "source": "исходный источник данных, зависит от клиента",
    "description": "описание индекса"
  },
  "documents": [
    {
      "doc_id": "doc42",
      "title": "Инструкция по решению такой-то технической проблемы",
      "text": "Чтобы решить такую-то техническую проблему, надо предпринять такие-то действия",
      "meta": {
        "title": "заголовок документа",
        "source_id": "исходный источник документа такой-то",
        "some_another_key": "some_another_value"
      }
    }
  ]
}

В дальнейшем данный index_name потребуется использовать для получения генеративных ответов. Можно использовать разные индексы для разных баз знаний, если при формировании ответа информация из них не должна пересекаться. Например, в разные индексы можно загрузить базы знаний для внутренней и для внешней поддержки или отдельно базу знаний для автоответов и отдельно — для подсказок оператору.
Для обновления базы знаний также используется метод Documents Post.
Проверить результат загрузки можно с помощью метода Get Index Documents, а список доступных индексов — с помощью метода Get Indexes List. Удалить документы можно с помощью метода Delete Index Documents, а индекс целиком с помощью метода Delete Index. Как работать с разными версиями индекса описано в разделе Работа с версиями индексов.
Обратите внимание, что большие документы при загрузке разбиваются на части меньшего размера. Идентификатор каждой такой части будет (идентификатор документа)_(номер части). Например, объемный документ с "doc_id": "instructions" будет загружен частями с идентификаторами "doc_id": "instructions_0", "instructions_1" и т.д.

При вызове метода Documents Post рекомендуется заранее заполнять метаинформацию об индексе для дальнейшего упрощения процессов администрирования системы. Раздел метаинформации об индексе содержит следующие поля:

source — Исходный источник данных, зависит от клиента. Можно указать основной источник данных, на базе которого собирался индекс.
description — Описание, какие данные содержит индекс.

Работа с версиями индексов

В Neurosupport реализовано версионирование индексов документов. Каждое изменение в индексе сохраняется в новую версию, между которыми при необходимости можно переключаться.

Получить информацию о текущей версии индекса можно с помощью метода Get Index Info.
Для переключения версии, на основе которой генерируются ответы, используйте метод Switch Index Version.
Для получения и загрузки документов в конкретную версию нужно явно указывать параметр index_version.
Обратите внимание, что при удалении документов нужно самостоятельно переключить версию или использовать параметр auto_switch.
При обычной загрузке документов с помощью метода Documents Post новая версия индекса будет содержать только загруженные документы, родительская версия индекса для нее отсутствует (index_parent_version будет null). При дозагрузке документов на основе существующей версии с указанием параметра diff новая версия будет содержать и документы из родительской версии, и новые загруженные документы (уже имеющиеся документы в новой версии будут актуализированы). В таком случае будет указана родительская версия индекса.

Например:

Создадим индекс 10_company_archive, для этого загрузим документы с помощью метода Documents Post . diff не указываем, т.к. создается новая версия индекса.
- Версия индекса: 1.
- Родительская версия: null.
- Версия для генерации ответов: 1.
Дозагрузим новые документы к уже имеющимся в индексе 10_company_archive. Метод Documents Post, diff равен True, т.к. документы загружаются к уже имеющимся.
- Версия индекса: 2.
- Родительская версия: 1.
- Версия для генерации ответов: 2.
Вернемся к предыдущей версии со старым набором документов для генерации ответов. Метод Switch Index Version, index_version равен 1.
- Версия индекса: 1.
- Родительская версия: null.
- Версия для генерации ответов: 1.
Удалим часть документов из версии за ненадобностью. Метод Delete Index Documents, явно указываем параметры index_version равным 1 и auto_switch равным True для переключения на новую версию индекса после удаления документов.
- Версия индекса: 3.
- Родительская версия: 1.
- Версия для генерации ответов: 3.
Для генерации ответов можно использовать любую из версий, переключившись на нее с помощью метода Switch Index Version, указав index_version.

Запрос генеративного ответа

После успешной загрузки документов можно переходить к этапу получения генеративных ответов.

Внимание

Передавайте реплики в правильном порядке по возрастанию времени и даты (вначале самая "старая" реплика, в конце — самая новая), при этом завершающей должна быть реплика клиента, на которую нужно сформировать ответ.

Для этого используется метод Answer Public. В запросе указываются ранее полученные параметры service и product, а также index_name, который загружали на этапе загрузки базы знаний.

Пример запроса

{
  "service": "your_service",
  "product": "your_product",
  "dialog": [
    {
      "role": "operator",
      "text": "Добрый день, чем я могу помочь?"
    },
    {
      "role": "client",
      "text": "Помогите решить такую-то техническую проблему"
    }
  ],
  "meta_features": {
    "user_name": "...",
    "user_created_date": "..."
  },
  "index_name": "your_index_name",
  "options": {
    "filter_settings": {
      "filter_by_meta": {
        "doc_meta_key1": [
          "doc_meta_value1",
          "doc_meta_value2"
        ],
        "doc_meta_key2": [
          "doc_meta_value3",
          "doc_meta_value4"
        ]
      },
      "document_ids": [
        "doc1",
        "doc45",
        "doc99"
      ]
    }
  }
}

Роли

В запросе в поле dialog → role рекомендуется использовать значения:

client — реплика или запрос клиента (того, кто обращается в техническую поддержку);
operator — ответ оператора (если требуется ответить на диалог, уже содержащий ответы оператора);
bot (также можно robot) — автоматические вопросы и ответы, которые дает чат-бот, например при определения тематики обращения или генерации каких-то стандартных ответов или сообщений (если требуется ответить на диалог, уже содержащий ответы робота).

Метаданные

Метаданные — это любая дополнительная информация, относящаяся к конкретному диалогу (и специфичная по отношению к данному диалогу). Метаданные необходимы для генерации корректного ответа.

Для передачи метаданных используется блок meta_features. В него рекомендуется передавать полностью русифицированный текст в виде списка «ключ: значение»:

<Название_поля_на_русском_языке_1>: <значение поля (если текст, то на русском)>
<Название_поля_на_русском_языке_2>: <значение поля (если текст, то на русском)>
…
<Название_поля_на_русском_языке_N>: <значение поля (если текст, то на русском)>

Пример

Номер заказа: 123
Регион: Москва
Метод оплаты: Наличные

Состав метаданных определяется исходя из потенциальной пользы для ответа на вопрос (и наличия этих данных на момент генерации ответа). Очень желательно не передавать в метаданных значений, которые никогда не будут использованы в ответах. Допустимо передавать общий список метаданных в каждом запросе, хотя в определенных тематиках/ситуациях потребуется использовать только часть. Не рекомендуется составлять список длиннее 3000 символов.

Если решаемая задача не подразумевает использование метаданных, рекомендуется оставлять это поле пустым.

Гибкая фильтрация по метаданным

Система предоставляет возможность гибкой фильтрации документов по их метаданным с помощью специального языка запросов для улучшения качества поиска и, как следствие, качества генеративных ответов. Возможно составлять сложные условия фильтрации, комбинируя различные операторы и условия.

Примеры использования API

Фильтрация при запросе ответа
Фильтр должен быть задан в поле filter_by_meta_query по пути /meta_features/filter_by_meta_query.

{
    "service": "test",
    "product": "test",
    "index_name": "test_index",
    "dialog": [
        {
            "role": "client",
            "text": "Какие популярные товары порекомендуете?"
        }
    ],
    "meta_features": {
    "filter_by_meta_query": "is_popular == true AND rating >= 4.5"
    }
}

Загрузка документов с метаданными

{
    "service": "test",
    "product": "test",
    "documents": [
        {
            "doc_id": "1",
            "text": "Описание товара",
            "title": "Товар 1",
            "typed_meta": {
                "params": [
                    {
                        "name": "is_popular",
                        "value": true,
                        "param_type": "bool"
                    },
                    {
                        "name": "rating",
                        "value": 4.7,
                        "param_type": "float"
                    },
                    {
                        "name": "str_arr",
                        "value": ["a", "b", "c"],
                        "param_type": "array[string]"
                    },
                    {
                        "name": "int_arr",
                        "value": [1, 2, 3],
                        "param_type": "array[int]"
                    },
                    {
                        "name": "bool_arr",
                        "value": [true],
                        "param_type": "array[bool]"
                    },
                ]
            }
        }
    ]
}

Синтаксис запроса

Запрос представляет собой строку, состоящую из условий, соединенных операторами AND и OR с возможностью группировки с помощью скобок.

Формат условия:
название_переменной оператор значение

Поддерживаемые операторы

Базовые операторы

Базовые операторы предназначены для работы с числами, строками и датами.

> — больше;
< — меньше;
== — равно;
!= — не равно;
>= — больше или равно;
<= — меньше или равно.

Специальные операторы

Специальные операторы предназначены для работы с массивами и строками. Операторы чувствительны к регистру. Например, оператор IN существует, а оператор in — нет.

IN — значение входит в массив (пример: x IN [1, 2]), работает для параметров типа int/string;
OUT — значение не входит в массив (пример: x OUT ["a", "b"]), работает для параметров типа int/string;
LIKE — сравнение строки с шаблоном (пример: name LIKE "%book%");
NOT LIKE — сравнение строки с шаблоном (пример: name NOT LIKE "%book%"), исключает все совпадения по патерну;
CONTAIN ALL — массив содержит все элементы списка (пример: int_arr CONTAIN ALL [1, 2, 3]);
CONTAIN ANY — массив содержит любой элемент списка (пример: int_arr CONTAIN ANY [1, 2, 3]);
NOT CONTAIN ALL — массив не содержит хотя бы 1 элемент списка, по сути отрицание к условию CONTAIN ALL (пример: int_arr NOT CONTAIN ALL [1, 2, 3]);
NOT CONTAIN ANY — массив не содержит ни одного элемента списка, по сути отрицание к условию CONTAIN ANY (пример: int_arr NOT CONTAIN ANY [1, 2, 3]).

Типы

Название типа	Соответствие в PostgreSQL	Диапазоны значений / Формат	Примеры
bool	`BOOLEAN`	`true`, `false`	`is_active == true` `is_active == false`
float	`FLOAT`	от `1E-307` до `1E+308`, `Infinity`, `-Infinity`	`rating > 4.5`
int	`BIGINT`	от `-2^63` до `2^63-1`	`avg_cost == 1400`
string	`TEXT`	Любая строка в двойных кавычках (`"..."`)	`title == "Test1" zone != "центр"`
date	`TIMESTAMPTZ`	Форматы: `%Y-%m-%d %H:%M:%S.%f` `%Y-%m-%d %H:%M:%S` `%Y-%m-%d` (в обратных кавычках `)	date >= `2022-01-01` date >= `2022-01-01 15:01:01` date >= `2022-01-01 15:01:01.12`
array[int]	`BIGINT[]`	Целые числа в `[ ]`	`ids CONTAIN ANY [1, 2, 3]` `scores NOT CONTAIN ANY [100, 200, 300]`
array[string]	`TEXT[]`	Строки в `[ ]` (в двойных кавычках)	`names CONTAIN ALL ["Alice", "Bob"]` `tags NOT CONTAIN ALL ["old", "archived"]`
array[bool]	`BOOLEAN[]`	`true/false` в `[ ]`	`flags CONTAIN ALL [true, false, true]` `options NOT CONTAIN ANY [true]`

Примеры рабочих запросов

Простые условия:
is_popular == true AND rating >= 4.0
Комбинированные условия:
(type IN [1, 2]) OR (name LIKE "%книга%") AND date >= `2025-06-18`
Сложная логика с группировкой:
(name != "устаревшая дока" AND (prev_version_name OUT ["легаси_1", "легаси_2"])) OR title LIKE "%доступно%"

Ограничения

Не поддерживаются:
- Отрицания перед выражениями (например, !(x >= 1));
- Обратные условия (например, [x, y] IN [1, 2] или 1 IN [x, y]);
- Смешанные типы в массивах (например, x IN ["1", 2]);
- Пустые массивы (например, x IN [])
Строгие требования к формату:
- Строки всегда в двойных кавычках: "текст";
- Даты всегда в обратных кавычках: `2025-01-01`;
- Массивы содержат значения только одного типа [1, 2, 3].

Настройки API

Формирование промпта

Чтобы передать в сервис свой шаблон промпта в теле запроса, используйте блок meta_features с предзаданным ключом custom_prompt_template.

Внутри шаблона допускаются 4 плейсхолдера (другие значения не поддерживаются):

{dialog_str} — обязательный;
{prompt_header} — опциональный;
{meta_str} — опциональный;
{knowledge_str} — опциональный.

Если эти плейсхолдеры будут найдены в custom_prompt_template, то они будут заменены на другие значения на стороне сервиса.

Предусмотрены следующие замены:

{dialog_str} — заменяется на переработанный для модели диалог, который обязателен для передачи в запросе и приходит в блоке dialog;
{meta_str} — заменяется на переработанную мета-информацию о запросе, которая передается в блоке meta_feature. Если в запросе никакие метаданные не переданы (а значит, в модель ничего передавать не нужно), то этот плейсхолдер можно убрать из custom_prompt_template;
{knowledge_str} — заменяется на тексты наиболее релевантных запросу документов, найденных на стороне сервиса. Если не требуется, чтобы сервис вставлял в промпт тексты релевантных документов, по которым нужно формировать ответ (то есть ответ формируется только на основании диалога), то можно убрать этот плейсхолдер из custom_prompt_template;
{prompt_header} — заменяется на заголовок системного промпта, который по дефолту задан на стороне сервиса. Если пользователю нужно передать в модель другие инструкции в качестве системного промпта, можно отправить ее вместо этого плейсхолдера.

Примеры данных, которые можно передать в качестве custom_prompt_template:

"{prompt_header}\n\n### Метаинформация: \n{meta_str}\n\n### Тексты:\n{knowledge_str}\n\n### Диалог:\n{dialog_str}" — шаблон промпта с максимальной заменой на стороне сервиса, к которому будет присоединен универсальный заголовок промпта из ссылки выше, метаинформацию запроса, тексты релевантных документов и непосредственно диалог.
"Помоги пользователю решить техническую проблему \n\n### Метаинформация: \n{meta_str}\n\n ### Тексты:\n{knowledge_str}\n\n ### Диалог:\n{dialog_str}" — промпт, который отдает в модель кастомный заголовок вместо универсального заголовка от сервиса.
"Помоги пользователю решить техническую проблему \n\n### Метаинформация: \n{meta_str}\n\n ### Диалог:\n{dialog_str}" — промпт, который отдает в модель кастомный заголовок вместо универсального заголовка от сервиса, при этом найденные тексты документов не будут использоваться.
"Помоги пользователю решить техническую проблему \n\n### Диалог:\n{dialog_str}" — промпт, который отдает в модель кастомный заголовок вместо универсального заголовка от сервиса, при этом найденные тексты документов не будут использоваться, а также в промпт не войдут метаданные запроса (даже если они будут переданы).

В {prompt_header} уже прописан алгоритм взаимодействия с базой знаний по умолчанию, поэтому если база знаний не соответствует стандартному формату или требует сложных взаимодействий, лучше использовать свой шаблон. Вот несколько простых правил, которые могут вам помочь:

Пропишите роль и задачу модели.
Сформулируйте четкий алгоритм взаимодействия с Базой Знаний.
Пример:
- Шаг 1: Определи проблему пользователя.
- Шаг 2: Найди в базе знаний релевантную ответу информацию.
- Шаг 3: Сформируй ответ на проблему пользователя в соответствии с найденной информацией.
Укажите четкие требования к ответу (редакционная политика): напишите, как модель может, а как не может отвечать, какие есть правила и ограничения для ответов.
Сформулируйте правила общения для модели в крайних случаях:
- Закрывающие сообщения для случаев, когда все проблемы пользователя уже решены, и надо попрощаться с пользователем.
- Уточняющие сообщения для случаев, когда пользователь нечетко сформулировал запрос, и нужно попросить его конкретизировать.
- Отказы от ответа для ситуаций, в которых вы не хотите, чтобы модель отвечала автоматически (также допускается и в Базе Знаний).
Допишите важную информацию, которую модели необходимо знать для ответа на запрос пользователя, и которая универсальна для всех запросов.
Примеры:
- Словарь общих понятий, специфичных для вашего домена.
- Общая справочная информация.

Пример шаблона

Ты лучший оператор технической поддержки <Название вашей компании или сервиса>. Твоя задача - давать ответы на запросы пользователя в чате поддержки

Чтобы ответить пользователю, выполни следующую последовательность действий:
- Шаг 1: Определи проблему пользователя
- Шаг 2: Найди в базе знаний релевантную ответу информацию
- Шаг 3: Сформируй ответ на проблему пользователя в соответствии с найденной информацией

## Редакционная политика
Отвечай пользователю на том же языке, на котором задан вопрос.
Будь вежлив и выражай готовность помочь.
Никогда не используй технические подробности.

## Правила общения
### Уточнения
Если проблема пользователя не ясна, то вместо ответа используй один из следующих шаблонов:
* Шаблон (Пользователь написал непонятный набор слов)
Я вас не очень понимаю. Пожалуйста, уточните, что Вы имели в виду?

### Завершение диалога
Если все проблемы пользователя были решены и новые он еще не озвучил, то вежливо попрощайся и вырази готовность помочь в дальнейшем

### Отказ от ответа
Если пользователь хамит и не идет на контакт, ответь "Я не могу с этим помочь."

## Контекст
### Словарь понятий
* Пользователь – это ваш собеседник, с которым ты ведешь диалог.
* Сервис – это название нашего сервиса. Если пользователь его упоминает, то он имеет в виду нас

### Общая справочная информация
Ссылка на личный кабинет: https://lk.servis-nash-servis.com
Коды регионов:
   - Москва: 77
   - Санкт-Петербург: 78

## Метаинформация
{meta_str}

## База знаний
{knowledge_str}

## История диалога с пользователем
{dialog_str}

Перед составлением собственного промпта можете ознакомиться с нашими общими рекомендациями по работе с LLM и промптами:

Скоринг

Скоринг (автоматическая система оценки качества ответа) выдает вещественное число в промежутке от 1 до 5. Оценка относительная и зависит от конкретной базы знаний и бизнес-кейса — в одной ситуации для конкретной базы знаний хороший ответ могут означать оценки выше 4, но для другой ситуации и другой базы знаний хорошими будут считаться ответы с оценкой выше 3.
На пороговое значение может повлиять сложность сценария ответа и базы знаний. Рекомендуется предварительно подобрать на тестовых примерах пороговое значение оценки, с которой можно пропускать автоответы.

Внимание

Включенный скоринг может увеличить время формирования ответа. По умолчанию скоринг отключен.

Количество чанков документов, которые передаются в модель

Для управления количеством чанков, которые передаются в модель, используется параметр candidates_top_k. По умолчанию значение равно 10.

Пример запроса

{
  "service": "your_service",
  "product": "your_product",
  "dialog": [
    {
      "role": "operator",
      "text": "Добрый день, чем я могу помочь?"
    },
    {
      "role": "client",
      "text": "Помогите решить такую-то техническую проблему"
    }
  ],
  "index_name": "your_index_name"
  "candidates_top_k": 3,
  "meta_features": {
  "custom_prompt_template": "{prompt_header}\n\n### Метаинформация: \n{meta_str}\n\n### Тексты:\n{knowledge_str}\n\n### Диалог:\n{dialog_str}"
  }
}

Ограничения API

в тестовом периоде: 10 запросов в минуту;
количество загружаемых индексов: не более 5;
в каждом индексе не более 1000 документов, объем одного документа не более 50 000 символов.

Рекомендации по улучшению качества ответов

Качество ответов существенно зависит от качества входных данных:

базы знаний (ее структура, релевантность и актуальность);
метаданных (достаточность для формирования генеративных ответов и доступность этих данных когда требуется сгенерировать ответ).

Часто на качество ответов может повлиять и длина диалога — если предыдущий диалог очень длинный, то вероятнее всего пользователь озвучил и уже получил ответ на несколько своих вопросов. Нередко качество ответа можно повысить, оставив в запросе только N последних реплик диалога (но здесь нет универсальных рекомендаций для значения N, это зависит от конкретного бизнес-сценария использования).

Оценка	Расшифровка	Критерий
5	Идеально	Ответили на все вопросы и дали отличный безошибочный ответ пользователю.
4	Хорошо	Написанный текст решает вопрос пользователя и по алгоритму является верным, но есть небольшие ошибки в формулировках и/или небольшие расхождения с редакционной политикой.
3	Средне	В целом, написанный текст отвечает на обращение, соответствует базе знаний и приближает к решению задачи, но требует правок (фразы и предложения): Не дописали какую-то значимую информацию. Ответили не на все вопросы пользователя, если их было несколько.
2	Плохо	Ответ абсолютно бесполезен и его нельзя было использовать в диалоге. Нужно писать правильный ответ с нуля. Совершенно не соответствует базе знаний. Не соответствует действительности и входным данным (например, решили проблему не по тому обращению или ответили не на тот вопрос). Дезинформирует пользователя.
1	Критично	Очень плохой ответ. Может вызвать риски, если пользователь получит такой текст. Критерии: Проникла NDA-информация. Использована неприемлемая лексика. Неразборчивый или непонятный текст.

Neurosupport

О сервисе

Получение доступа

Интеграция

Архитектура интеграции

Описание структуры API

Рекомендации по использованию API

Загрузка базы знаний

Работа с версиями индексов

Запрос генеративного ответа

Роли

Метаданные

Гибкая фильтрация по метаданным

Поддерживаемые операторы

Типы

Примеры рабочих запросов

Ограничения

Настройки API

Формирование промпта

Скоринг

Количество чанков документов, которые передаются в модель

Ограничения API

Рекомендации по улучшению качества ответов

Рекомендации по структуре базы знаний

Рекомендации по формату базы знаний

Рекомендации к тестированию и оценке качества

Была ли статья полезна?

Neurosupport

О сервисеО сервисе

Получение доступаПолучение доступа

ИнтеграцияИнтеграция

Архитектура интеграцииАрхитектура интеграции

Описание структуры APIОписание структуры API

Рекомендации по использованию APIРекомендации по использованию API

Загрузка базы знанийЗагрузка базы знаний

Работа с версиями индексовРабота с версиями индексов

Запрос генеративного ответаЗапрос генеративного ответа

РолиРоли

МетаданныеМетаданные

Гибкая фильтрация по метаданнымГибкая фильтрация по метаданным

Поддерживаемые операторыПоддерживаемые операторы

ТипыТипы

Примеры рабочих запросовПримеры рабочих запросов

ОграниченияОграничения

Настройки APIНастройки API

Формирование промптаФормирование промпта

СкорингСкоринг

Количество чанков документов, которые передаются в модельКоличество чанков документов, которые передаются в модель

Ограничения APIОграничения API

Рекомендации по улучшению качества ответовРекомендации по улучшению качества ответов

Рекомендации по структуре базы знанийРекомендации по структуре базы знаний

Рекомендации по формату базы знанийРекомендации по формату базы знаний

Рекомендации к тестированию и оценке качестваРекомендации к тестированию и оценке качества

Была ли статья полезна?

О сервисе

Получение доступа

Интеграция

Архитектура интеграции

Описание структуры API

Рекомендации по использованию API

Загрузка базы знаний

Работа с версиями индексов

Запрос генеративного ответа

Роли

Метаданные

Гибкая фильтрация по метаданным

Поддерживаемые операторы

Типы

Примеры рабочих запросов

Ограничения

Настройки API

Формирование промпта

Скоринг

Количество чанков документов, которые передаются в модель

Ограничения API

Рекомендации по улучшению качества ответов

Рекомендации по структуре базы знаний

Рекомендации по формату базы знаний

Рекомендации к тестированию и оценке качества