формат файла .XML не предназначен для перевода и требует дополнительных настройки для успешного импортировать.
Настройки по умолчанию помечены звездочкой (*) и будут импортированы все элементы XML для перевода. Можно использовать параметры импортировать, чтобы изменить поведение импортируемых.
Чат-боты искусственного интеллекта (ИИ) могут очень эффективно выявлять проблемы формата в файлах на основе .XML.
Типы файлов
-
.XML
Параметры импорта
Простые импортируемые правила
-
Импортируются только выбранные элементы (например, название, должность, параграф). Звездочка ( ) импортирует все элементы.
-
Импортируются только выбранные атрибуты (например, имя, должность, параграф). Звездочка ( ) импортирует все атрибуты.
-
Если выбран параметр «переводимые строковые элементы.
», все элементы в переводимом тексте импортируются как -
Выбранные имя, название, пара строковых элементов будут преобразованы в tags, и контент не будет переводимым.
ВАЖНО:
Проблемы с tags являются распространенной причиной экспортируемых ошибок, особенно для таких типов файлов, как таблицы (на основе MS Excel) и .XML. Всегда проверяйте правильность tags и форматирования перед экспортом файлов, проводя проверку контроля качества.
-
Элементы, являющиеся соседями текстовых узлов, будут автоматически преобразованы в строковые tags.
-
Код выбранного элемента обрабатывается как .HTML. Настройки импорта .HTML, такие как Сохранить пробелы или тег разрыва (<br/>), создают новый сегмент для этих элементов.
Используйте этот параметр, если выбранное значение элемента содержит разметку .HTML. Он не применяется к дочерним элементам выбранного элемента, если не указано иное.
-
Выбранные элементы будут импортированы как Заблокированные.
-
Выбранные атрибуты будут импортированы как Заблокированные.
-
Сообщения ICU автоматически конвертируются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.
-
Сущности XML в Декларации DTD будут импортированы для перевода.
-
Снять выделение, если сегментация не нужна.
-
Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Элементы (обрабатываются как HTML).
-
Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
-
Введите список ссылок на символы (через запятые) в файл результатов.
Например:
Настройки XML с использованием XPath
Использование языка запросов XPath позволяет создавать сложные импортируемые правила и некоторые дополнительные функции, недоступные в обычных импортируемых правилах.
Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых следует перевести, а не сам текстовый узел.
Перед использованием рекомендуется ознакомиться с XPath.
, и не будут обрабатываться для файлов с более чем 10 000 элементов XML.
-
Составляет контекст памяти переводов (TM) (101% совпадения), если это применимо.
-
Импортировать элементы или контекстные атрибуты для каждого элемента.
-
Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели в редакторе. Любой символ, превышающий лимит, выделен красным цветом.
-
Не empty для сохранения пробелов в элементах. Примените xml: whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или используйте произвольное выражение XPath.
Предварительный просмотр HTML с таблицей стилей XSLT
Язык XSLT (форматы расширяемых таблиц языков стиля) можно использовать для преобразования документов .XML в формат .HTML для целей контекстного предварительного просмотра. Соответственно, файлы предварительного просмотра, загруженные через перевод предварительного просмотра в меню Документ, имеют расширение HTML. Phrase в настоящее время поддерживает XSLT 2.0.
Нажмите «Выбрать файл», чтобы импортировать таблицу стилей.
Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импорта файла.
CDATA в файле XML
CDATA означает Данные символов и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Заданные сущности, такие как < ,
>
и &
, требуют ввода текста и, как правило, их трудно прочесть в разметке. В таких случаях можно использовать раздел CDATA.
Если CDATA содержит встроенный .HTML, соответствующие элементы XML должны быть указаны в разделе
.Если файл оригинала содержит CDATA и используется
, CDATA добавляется к каждому сегменту в файле «Завершено».CDATA будет сегментирована, только если есть очищенные признаки разрыва сегмента, такие как пунктуация или расстояние между сегментами.
Источник:
<text><![CDATA[Переводимый текст А. Переводимый текст В.]]></text>
Перевод:
<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>
Завершенный файл действителен .XML, и программа просмотра XML верно отобразит текст в виде переводимого текста A. Переводимый текст B.
Многоязычные файлы импортируются как несколько двуязычных заданий с сопоставлением языков перед импортом. Они представлены в таблице заданий. Завершенный файл будет импортирован на несколько языков перевода.
phrase поддерживает файлы XML, в которых элементы оригинал и перевод присутствуют для всех абзацев, даже если перевод empty При различии сегментации оригинала и перевода сегментация оригинала является определяющей.
Все отдельные элементы языка должны быть потомками одного и того же трансъединичного элемента, и один язык не может содержаться внутри другого. Оригинал и перевод контента не могут храниться в значениях атрибутов. При совпадении нескольких элементов с XPath для оригинала или перевода внутри элемента Trans- Unit на перевод импортируется только первый.
-
При создании задания выберите на панели « , прежде чем применять Параметры импортировать. Если это не указано, файл будет импортирован в формате стандарта .XML.
-
Контент тегов исходника файла .XML можно просмотреть в редакторе, нажав Expand tags в меню « , и отредактировать, нажав F2.
Например:
Образец частично переведенного текста с английского на немецкий и французский языки. Все <tuv lang="en">
, <tuv lang="de">
и <tuv lang="fr">
являются дочерними элементами одного и того же <tu>
элемента.
<?xml версия="1.0" кодировка="utf-8"?> <root> Не переводимый текст. <tu note="контекстное примечание" ключ="Идентификатор 254" maxlen="16"> <tuv lang="en"> <seg>Первый сегмент.</seg> </tuv> <tuv lang="de"> <seg>Сегмент Erste</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="еще одно контекстное примечание" ключ="Идентификатор 255" maxlen="18"> <tuv lang="en"> <seg>Второй сегмент.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Параметры импорта
Чтобы импортировать многоязычные файлы .XML, необходимо использовать язык запросов XPath. См. пример выше. Выражение XPath определяет элементы, в которые следует перевести текст/значение, а не сам текстовый узел.
-
//tu
-
tuv[@lang='en']/seg
(в отношении родительского элемента//tu
) -
tuv[@lang='de']/seg
(в связи с элементом ренты в pa/tu
) -
tuv[@lang='fr']/seg
(в отношении родительского элемента//tu
) -
Все элементы в оригинале или переводе считаются Переводимыми строковыми элементами, если они не указаны здесь как Непереводимые строковые элементы.
-
Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
-
Укажите контекстный ключ, сохраненный вместе с сегментом в памяти переводов и используемый для совпадения контекста.
-
Импортировать элементы или контекстные атрибуты для каждого элемента.
-
Импортировать элементы или максимальную длину перевода для каждого элемента
-
Введите список ссылок на символы (через запятые) в файл результатов.
Например:
-
Сообщения ICU автоматически конвертируются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.
-
Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками Импортировать файлы HTML. Paragraph tags
<p>
создаст новые сегменты, даже если не выбран . -
Текст сегментируется общим правилом сегментации, а не одним сегментом в клетке.
Осторожно
Применение
к файлу, содержащему текст перевода, может привести к тому, что количество сегментов в оригинале будет отличаться от количества сегментов в переводе. -
Выберите статус подтверждения по умолчанию и будет ли подтверждено сегментов автоматически добавлено в память переводов (TM).
Пример: