.XML - Extensible Markup Language (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Формат файла .XML не предназначен для перевода и требует дополнительных настроек для успешного импорта.

Настройки по умолчанию помечены звездочкой (*) и импортируют все XML элементы для перевода. Опции импорта можно использовать, чтобы изменить поведение импорта.

Сервисы искусственный интеллект (ИИ) могут быть очень эффективны при выявлении проблем с формат в файлах на основе .XML.

Типы файлов

.XML

Параметры импорта

Простые правила импорта

Элементы

Импортируются только выбранные элементы (т.е. name, title, para). Звездочка (*) импортирует все элементы.
Атрибуты

Импортируются только выбранные атрибуты (т.е. name, title, para). Звездочка (*) импортирует все атрибуты.
Переводимые строковые элементы

Если выбрана опция Автоматически определять строковые элементы, все элементы в переводимом контенте импортируются как Переводимый строковый элемент.
Непереводимые строковые элементы

Выбранный строковый элемент name, title, para будет преобразован в теги, и контент не будет переводимым.

Важно

Проблемы с тегами являются частой причиной ошибок при экспорте (например, Файл не удалось создать), особенно для таких типов файлов, как электронные таблицы (на базе MS Excel) и .XML. Всегда проверяйте правильность тегов и форматирования перед экспортом файлов, запуская проверки контроль качества.
Автоматически определять строковые элементы

Элементы, являющиеся соседями текстовых узлов, будут автоматически преобразованы в строковые теги.
Элементы (обрабатываются как HTML)

Код выбранного элемента обрабатывается как .HTML. Для этих элементов можно использовать настройки импорта .HTML, такие как Сохранять пробелы или Тег разрыва (<br/>) создает новый сегмент.

Используйте эту опцию, когда значение выбранного элемента содержит разметку .HTML. Это не применяется к дочерним элементам выбранного элемента, если не указано иное.
Заблокированные элементы

Выбранные элементы будут импортированы как Заблокированный.
Заблокированные атрибуты

Выбранные атрибуты будут импортированы как заблокированный.
Преобразование в символьные сущности

Введите список ссылок на символ (разделенных запятыми) в файл результата.

Например:

Если требуются кавычки ("), они будут представлены как ", символ Σ будет представлен как Σ использовать ",Σ . & и < всегда экспортируются как & и < соответственно.
Преобразовать в теги системы Phrase TMS

Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
Разобрать сообщения ICU

Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, синтаксический анализ ICU для этого сегмента пропускается. Сегменты без встроенных элементов анализируются обычным образом.
Импортировать сущности XML

XML-сущности в Объявление DTD будут импортированы для перевода.
Развернуть пользовательские общие сущности
Импорт комментариев

Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в параметре Элементы (обрабатываются как HTML).
Исключить субэлементы из сегментации

Выберите, чтобы предотвратить сегментация внутри парных тегов XML или подэлементов. Это полезно, если XML содержит вложенные структуры, где сегментация нарушила бы логический смысл текста.
Создать предпросмотр файла XSLT

Можно загрузить таблицу стилей .XSL и создать на ее основе файл для предварительного просмотра.

Настройки XML с использованием XPath

Использование языка запросов XPath позволяет создавать сложные правила импорта и некоторые дополнительные функции, недоступные в обычных правилах импорта.

Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых следует перевести, а не сам текстовый узел.

Перед использованием рекомендуется ознакомиться с XPath.

Контекстное примечание, Контекстный ключ и Макс. длина перевода не будут обрабатываться для файлов, содержащих более 10 000 XML-элементов.

Контекстный ключ

Составляет контекст памяти переводов (TM) (101% совпадения), если это применимо.

Если для контекстный ключ не указано выражение XPath, XML-фильтр не создает контекстный ключ по умолчанию. Чтобы создать контекстный ключ на основе структурного пути сегмента, установите для Сегмент контекст значение Сегмент ключ в настройках импорта память переводов.
Контекстное примечание

Импортировать элементы или контекстные атрибуты для каждого элемента.
Макс. длина сегмента в переводе

Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели контекстных примечаний в редакторе. Любой символ, превышающий лимит, выделен красным цветом.
Не удалять пробелы

Оставьте пустым, чтобы сохранить пробелы в элементах. Примените xml:whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или использовать произвольное выражение XPath.
Узлы исключаются из сегментации

Укажите XML-элементы или атрибуты, которые не должны подвергаться сегментации. Введите выражение XPath, которое определяет узлы, подлежащие исключению. Любой текст, извлеченный из этих узлов, будет сохранен как единый сегмент, а не разделен на более мелкие единицы.

Введите //element[@attr='value'], чтобы Исключить все <element> узлы, содержащие атрибуты attr=\"value\", из процесса сегментация.

Предварительный просмотр HTML с помощью таблицы стилей XSLT

Язык XSLT (Extensible Stylesheet Language Transformations) можно использовать для преобразования .XML-документов в формат .HTML для целей предварительный просмотр в контексте. Соответственно, файлы для предварительный просмотр, полученные через скачивание Preview translation в меню Документ, имеют расширение HTML. Phrase в настоящее время поддерживает XSLT 2.0.

XSLT, используемый для предварительный просмотр, должен основываться на перевод, а не на оригинал.

Нажмите Choose file, чтобы импортировать таблицу стилей.

Нажмите Download XSLT, чтобы выполнить скачивание таблицы стилей после импорта файла.

CDATA в XML-файле

CDATA означает символьные данные (Character Data) и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Предопределенные сущности, такие как <, > и &, требуют ввода и, как правило, трудночитаемы в разметке. В таких случаях можно использовать раздел CDATA.

Если CDATA содержит встроенный .HTML, соответствующие XML-элементы должны быть перечислены в разделе Elements (processed as HTML).

Если оригинал содержит CDATA и используется Segment XML, то CDATA добавляется к каждому сегмент в готовом файле.

CDATA будет подвергаться сегментации только при наличии четкого указания на разрыв сегмент, например, знаков препинания или пробелов.

Оригинал:

<text><![CDATA[Переводимый текст A. Переводимый текст B.]]></text>

Перевод:

<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>

Завершенный файл является допустимым .XML, и программа просмотра XML будет правильно отображать текст как Переводимый текст A. Переводимый текст B.

Настройки, специфичные для приложения

Wordpress XML

Рекомендуемые настройки для Wordpress XML:

XML

XPath
Элементы и атрибуты

//*[local-name()='encoded']|//description|//title
Элементы (обрабатываются как HTML)

//*[local-name()='encoded']|//description|//title
Преобразовать в теги Phrase

(\[[^\]]++\])++

Выбрать Сохранять пробелы в настройках HTML.

Многоязычные XML

Многоязычные файлы импортируются как несколько двуязычных заданий с языками, сопоставленными перед импортом. Они представлены с помощью в таблице задания. При импорте на несколько языков перевода Завершенный файл состоит из всех языков перевода.

Phrase поддерживает XML-файлы, в которых присутствуют элементы оригинал и перевод для всех абзацев, даже если перевод пустой. Когда сегментация оригинал и перевод различаются, определяющей является сегментация оригинал.

Все отдельные языковые элементы должны быть потомками одного и того же элемента trans-unit, и один язык не может содержаться внутри другого. Контент оригинал и перевод не могут храниться в значениях атрибуты. Если несколько элементов соответствуют XPath для оригинал или перевод внутри элемента trans-unit, для перевода импортируется только первый из них.

При создании задание выберите Многоязычные XML на панели Тип файла перед применением параметров импорта. Если не указано иное, файл будет импортирован как стандартный .XML.
Контент тег исходного .XML-файла можно визуализировать в редактор, нажав Развернуть теги в меню Инструмент, и отредактировать, нажав F2.

Например:

Образец частично переведенного текста с английского на немецкий и французский языки. Все <tuv lang=\"en\">, <tuv lang=\"de\"> и <tuv lang=\"fr\"> являются дочерними элементами одного и того же <tu> родительский элемент.

<?xml version=\"1.0\" encoding=\"utf-8\"?>
<root>
Не переводимый текст.
<tu note=\"контекстное примечание\" key=\"Идентификатор 254\" maxlen=\"16\"> 
  <tuv lang="en">
    <seg>Первый сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Первый сегмент</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note=\"другое контекстное примечание\" key=\"Идентификатор 255\" maxlen=\"18\"> 
  <tuv lang="en">
    <seg>Второй сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Параметры импорта

Для импортировать многоязычный .XML файлов необходимо использовать язык запрос XPath. См. пример выше для справочный файл. Выражение XPath определяет элементы, в которых текст/значение должны быть переведены, а не сам текстовый узел.

Элементы, содержащие вложенные элементы исходного файла и файла перевода

//tu
Элементы, содержащие исходный текст

tuv[@lang='en']/seg (по отношению к родительский элемент //tu)
Непереводимые строковые элементы

Все элементы в оригинале или переводе считаются переводимыми встроенными элементами, если здесь они не указаны как непереводимые встроенные элементы.
Контекстный ключ

Укажите контекстный ключ, который сохраняется вместе с сегментом в память переводов (TM) и используется для контекста совпадения.
Контекстное примечание

Импортировать элементы или контекстные атрибуты для каждого элемента.
Макс. длина сегмента в переводе

Импортировать элементы или максимальную длину перевода для каждого элемента
Преобразование в символьные сущности

Введите список ссылок на символ (разделенных запятыми) в файл результата.

Например:

Если требуются кавычки ("), они будут представлены как ", символ Σ будет представлен как Σ использовать ",Σ . & и < всегда экспортируются как & и < соответственно.
Преобразовать в теги системы Phrase TMS

Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
Разобрать сообщения ICU

Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, синтаксический анализ ICU для этого сегмента пропускается. Сегменты без встроенных элементов анализируются обычным образом.
Использовать подфильтр HTML

Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML. Теги абзацев <p> будут создавать новые сегменты, даже если многоязычный сегмент XML не выбран.
Использовать подфильтр HTML

Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML.
Сегментировать многоязычный XML

Текст сегментируется по общему правилу сегментации, а не по одному сегменту на ячейку.

Осторожно

Применение многоязычного сегмента XML к файлу, содержащему текст перевода, может привести к разному количеству сегментов в оригинале и в переводе.
Установить статус сегмента отсутствующего перевода

Выберите статус подтверждения по умолчанию и укажите, будут ли подтвержденные сегменты автоматически добавляться в память переводов (TM).
Создать предпросмотр файла XSLT

Можно загрузить таблицу стилей .XSL и создать на ее основе файл для предварительного просмотра.

Пример:

Если многоязычный .XML содержит пространство имен, XPath может быть следующим:

Элементы, содержащие вложенные элементы исходного файла и файла перевода

//*[local-name()='trans-unit']
Элементы, содержащие исходный текст

*[local-name()='source']
Элементы, содержащие текст перевода

*[local-name()='target']

.XML - Extensible Markup Language (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Типы файлов

Параметры импорта

Важно

Предварительный просмотр HTML с помощью таблицы стилей XSLT

CDATA в XML-файле

Настройки, специфичные для приложения

Wordpress XML

Многоязычные XML

Параметры импорта

Осторожно