Настройки импорта файла

.XML - Extensible Markup Language (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Формат файла .XML не предназначен для перевода и требует дополнительных настроек для успешного импорта.

Настройки по умолчанию отмечены звездочкой (*) и будут импортировать все элементы XML для перевода. Опции импорта могут быть использованы для изменения поведения импорта.

Сервисы ИИ могут быть очень эффективными в выявлении проблем с форматом в файлах на основе .XML.

Типы файлов

  • .XML

Параметры импорта

Простые правила импорта

  • Элементы

    Импортируются только выбранные элементы (т.е. имя, заголовок, параграф). Звездочка (*) импортирует все элементы.

  • Атрибуты

    Импортируются только выбранные атрибуты (т.е. имя, заголовок, параграф). Звездочка (*) импортирует все атрибуты.

  • Переводимые строковые элементы

    Если выбрана опция Автоматически определять строковые элементы, все элементы в переводимом тексте импортируются как Переводимые строковые элементы.

  • Непереводимые строковые элементы

    Выбранный строковый элемент имя, заголовок, параграф будет преобразован в теги, и контент не будет переводимым.

    Важно

    Проблемы с тегами являются распространенной причиной ошибок экспорта (например, Файл не может быть сгенерирован), особенно для таких типов файлов, как таблицы (на основе MS Excel) и .XML. Всегда убедитесь, что теги и форматирование правильные перед экспортом файлов, проводя проверки контроля качества.

  • Автоматически определять строковые элементы

    Элементы, которые являются соседями текстовых узлов, будут автоматически преобразованы в строковые теги.

  • Элементы (обрабатываются как HTML)

    Код выбранного элемента обрабатывается как .HTML. Настройки импорта .HTML, такие как Сохранить пробелы или Тег разрыва (<br/>) создает новый сегмент, могут быть использованы для этих элементов.

    Используйте эту опцию, когда значение выбранного элемента содержит разметку .HTML. Это не применяется к дочерним элементам выбранного элемента, если не указано иное.

  • Заблокированные элементы

    Выбранные элементы будут импортированы как Заблокированный.

  • Заблокированные атрибуты

    Выбранные атрибуты будут импортированы как Заблокированный.

  • Преобразование в символьные сущности

    Введите список ссылок на символы (разделенных запятыми) в выходной файл.

    Например:

    Если требуются кавычки ("), они будут представлены как &quot;, символ Σ будет представлен как &#x3A3;, используйте &quot;,&#x3A3;. & и < всегда экспортируются как &amp; и &lt; соответственно.

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения, чтобы преобразовать указанный текст в теги.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, парсинг ICU для этого сегмента пропускается. Сегменты без встроенных элементов обрабатываются нормально.

  • Импортировать сущности XML

    XML-сущности в DTD Declaration будут импортированы для перевода.

  • Развернуть пользовательские общие сущности

  • Импорт комментариев

    Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Elements (processed as HTML).

  • Исключить субэлементы из сегментации

    Выберите, чтобы предотвратить сегментацию внутри парных тегов XML или подс элементов. Это полезно, если XML содержит вложенные структуры, где сегментация нарушила бы логическое значение текста.

  • Создать предпросмотр файла XSLT

    Файл стиля .XSL можно загрузить и сгенерировать читаемый файл предварительного просмотра из него.

XML настройки с использованием XPath

Использование языка запросов XPath позволяет создавать сложные правила импорта и некоторые дополнительные функции, недоступные в обычных правилах импорта.

Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых должно быть переведено, а не фактический текстовый узел.

Рекомендуется ознакомиться с XPath перед использованием.

Контекстное примечание, Контекстный ключ и Макс. длина перевода не будут обрабатываться для файлов с более чем 10 000 XML-элементов.

  • Контекстный ключ

    Составляет контекст памяти переводов (TM) (101% совпадения), если это применимо.

  • Контекстное примечание

    Импортируйте элементы или контекстные атрибуты для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели контекстных примечаний в редакторе. Любой символ, превышающий лимит, выделен красным цветом.

  • Не удалять пробелы

    Оставьте пустым, чтобы сохранить пробелы в элементах. Примените xml:whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или используйте произвольное выражение XPath.

  • Узлы исключаются из сегментации

    Укажите XML-элементы или атрибуты, которые не должны быть сегментированы. Введите выражение XPath, которое определяет узлы, которые следует исключить. Любой текст, извлеченный из этих узлов, будет сохранен как один сегмент, а не разделен на более мелкие единицы.

    Введите //element[@attr='value'], чтобы исключить все <element> узлы, содержащие атрибут attr="value" из сегментации.

HTML предварительный просмотр с XSLT таблицей стилей

Язык XSLT (Расширяемый язык преобразования таблиц стилей) может использоваться для преобразования .XML документов в .HTML формат для предварительного просмотра в контексте. Соответственно, файлы предварительного просмотра, загруженные через Предварительный просмотр перевода в меню Документ, имеют расширение HTML. Фраза в настоящее время поддерживает XSLT 2.0.

XSLT, используемый для предварительного просмотра, должен основываться на целевом, а не исходном.

Нажмите Выбрать файл, чтобы импортировать таблицу стилей.

Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импорта файла.

CDATA в XML файле

CDATA означает Символьные данные и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Предопределенные сущности, такие как &lt;, &gt;, и &amp; требуют ввода и, как правило, трудно читаемы в разметке. В таких случаях можно использовать секцию CDATA.

Если CDATA содержит встроенный .HTML, соответствующие XML элементы должны быть перечислены под Элементы (обрабатываемые как HTML).

Если исходный файл содержит CDATA и используется Сегмент XML, то CDATA добавляется к каждому сегменту в завершенном файле.

CDATA будет сегментироваться только в том случае, если есть четкое указание на разрыв сегмента, такое как пунктуация или пробел.

Исходный:

<text><![CDATA[Переводимый текст A. Переводимый текст B.]]></text>

Целевой:

<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>

Завершенный файл является действительным .XML, и XML просмотрщик будет правильно отображать текст как Переводимый текст A. Переводимый текст B.

Настройки, специфичные для приложения

Wordpress XML

Рекомендуемые настройки для Wordpress XML:

  • XML

    XPath

  • Элементы и атрибуты

    //*[local-name()='encoded']|//description|//title

  • Элементы (обрабатываются как HTML)

    //*[local-name()='encoded']|//description|//title

  • Преобразовать в теги Phrase

    (\[[^\]]++\])++

Выберите Сохранить пробелы в настройках HTML.

Многоязычный XML

Многоязычные файлы импортируются как несколько двуязычных заданий с языками, сопоставленными перед импортом. Они представлены как multilingual_xml.png в таблице задания. Если импортировано на несколько целевых языков, файл Завершено состоит из всех целевых языков.

Фраза поддерживает XML файлы, в которых присутствуют как исходные, так и целевые элементы для всех абзацев, даже если целевой элемент пуст. Когда сегментация исходного и целевого языков различна, сегментация исходного языка является определяющей.

Индивидуальные языковые элементы должны быть потомками одного и того же элемента trans-unit, и один язык не может содержаться в другом. Содержимое исходного и целевого языков не может храниться в значениях атрибутов. Если несколько элементов соответствуют XPath для исходного или целевого языков внутри элемента trans-unit, только первый из них импортируется для перевода.

  • При создании задания выберите Многоязычный XML в панели Тип файла перед применением параметров импорта. Если не указано иное, файл будет импортирован как стандартный .XML.

  • Содержимое тегов исходного .XML файла можно визуализировать в редакторе, нажав Развернуть теги в меню Инструмент и редактировать, нажав F2.

Например:

Пример частично переведенного текста с английского на немецкий и французский. Все <tuv lang="en">, <tuv lang="de"> и <tuv lang="fr"> являются дочерними элементами одного и того же <tu> элемента.

<?xml version="1.0" encoding="utf-8"?>
<root>
Не переводимый текст.
<tu note="контекстное примечание" key="Идентификатор 254" maxlen="16"> 
  <tuv lang="ru">
    <seg>Первый сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="другое контекстное примечание" key="Идентификатор 255" maxlen="18"> 
  <tuv lang="ru">
    <seg>Второй сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Параметры импорта

Для импорта многоязычных .XML файлов необходимо использовать язык запросов XPath. Смотрите пример выше для справки. Выражение XPath определяет элементы, в которых текст/значение должно быть переведено, а не фактический текстовый узел.

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    //tu

  • Элементы, содержащие исходный текст

    tuv[@lang='ru']/seg (в отношении родительского элемента //tu)

  • Непереводимые строковые элементы

    Все элементы в источнике или цели считаются переводимыми встроенными элементами, если не указано иное как непереводимые встроенные элементы.

  • Контекстный ключ

    Укажите контекстный ключ, который сохраняется с сегментом в памяти переводов и используется для контекста совпадения.

  • Контекстное примечание

    Импортируйте элементы или контекстные атрибуты для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента

  • Преобразование в символьные сущности

    Введите список ссылок на символы (разделенных запятыми) в выходной файл.

    Например:

    Если требуются кавычки ("), они будут представлены как &quot;, символ Σ будет представлен как &#x3A3;, используйте &quot;,&#x3A3;. & и < всегда экспортируются как &amp; и &lt; соответственно.

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения, чтобы преобразовать указанный текст в теги.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, парсинг ICU для этого сегмента пропускается. Сегменты без встроенных элементов обрабатываются нормально.

  • Использовать подфильтр HTML 

    Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML. Теги абзацев <p> создадут новые сегменты, даже если Сегмент Многоязычный XML не выбран.

  • Использовать подфильтр HTML

    Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML.

  • Сегментировать многоязычный XML

    Текст сегментируется по общей правиле сегментации, а не по одному сегменту на ячейку.

    Осторожно

    Применение Сегмент многоязычный XML к файлу, содержащему целевой текст, может привести к различному количеству сегментов в источнике и в цели.

  • Установить статус сегмента отсутствующего перевода 

    Выберите статус подтверждения по умолчанию и то, будут ли подтвержденные сегменты автоматически добавлены в TM.

  • Создать предпросмотр файла XSLT

    Файл стиля .XSL можно загрузить и сгенерировать читаемый файл предварительного просмотра из него.

Пример:

Если многоязычный .XML содержит пространство имен, XPath может быть следующим:

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    //*[local-name()='trans-unit']

  • Элементы, содержащие исходный текст

    *[local-name()='source']

  • Элементы, содержащие текст перевода

    *[local-name()='target']

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.