Собственные глоссарии для перевода
Чтобы повысить точность перевода в текстах на специфические темы, передайте глоссарий в запросе. Глоссарий — словарь слов и словосочетаний с однозначным переводом.
Сейчас глоссарий передается как массив текстовых пар в самом запросе. В будущем мы добавим возможность создавать глоссарии из файлов заранее.
Нейроглоссарии
При переводе сервис учитывает различные формы слов, например падеж или род.
Например, если в глоссарии указать, что «черный» переводится как «dark», то фраза «самая черная комната» будет переведена как «the darkest room».
Сейчас это работает на следующих языках: ar
, bg
, cs
, de
, en
, es
, fr
, it
, kk
, pl
, ru
, tr
, tt
, uk
.
Параметр exact
(bool) в глоссариях передается с каждой парой и позволяет задать перевод конкретного термина в нейроглоссариях. Например, если указать, что «table» переводится как «таблицей», то фраза «It is a table» будет переведена как «Это таблицей».
Если язык не поддерживается нейроглоссарием, применять этот параметр не имеет смысла. Он может не всегда срабатывать или срабатывать неточно, поэтому лучше использовать экранирование.
Мультиглоссарии
При переводе сервис учитывает различные формы слов, например падеж или род.
В отличие от нейроглоссария, в мультиглоссарии вы вручную указываете варианты перевода для одного и того же слова. Нейросеть выберет подходящий вариант в зависимости от контекста. Например, «cat» — кошка и кот.
Наиболее эффективно сервис работает с близкими или синонимичными значениями перевода. Если передать совсем разные значения, может возникнуть путаница. Например, «letter» — письмо и буква.
Мультиглоссарий работает со всеми языками, для которых доступны глоссарии.
Капитализация перевода с использованием глоссария
Перевод глоссарных терминов учитывает капитализацию переданного перевода. При определении капитализации используются правила:
- Если термин написан строчными буквами, то его капитализация будет определяться автоматически по исходному тексту.
- Если термин начинается или полностью написан заглавными буквами, то его капитализация в переводе будет совпадать с заданной в глоссарии.
- Если в термине есть и заглавные, и строчные буквы, но он начинается со строчной, будет найдена максимальная общая подстрока у термина и сгенерированного перевода. Капитализация в переводе будет скопирована из термина, а остальные символы будут строчными.
Пример:
Исходный текст:
I saw a KITTEN
.Глоссарий:
kitten
→котенок
.
Перевод:Я видел КОТЕНКА
.Глоссарий:
kitten
→Котенок
.
Перевод:Я видел Котенка
.Глоссарий:
kitten
→КОТЕНОК
.
Перевод:Я видел КОТЕНКА
.Глоссарий:
kitten
→КотЕнОк
.
Перевод:Я видел КотЕнка
.
Как использовать глоссарии
- Включайте в глоссарий только те слова и фразы, которые должны иметь однозначный перевод. Чем больше глоссарий — тем больше риск, что в тексте встретится слово из глоссария, но в другом значении.
- Глоссарии хорошо подходят для перевода названий, например имени бренда или продукта.
- Используйте глоссарии с учетом ограничений, описанных в разделе Квот и лимитов.
Ограничения в текущей версии
- Вы можете передать глоссарий только в виде массива текстовых пар. В будущем мы добавим возможность передать глоссарий в виде файла.
- Поддерживаются только глоссарии с направленным переводом. Если вы указали в исходном тексте «масло», а в переводе «oil», то это будет работать для перевода с русского на английский.
- Глоссарии работают не для всех языковых пар. См. список поддерживаемых направлений перевода.