Настройки импорта файла

.XML — расширяемый язык разметки (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

формат файла .XML не предназначен для перевода и требует дополнительных настройки для успешного импортировать.

Настройки по умолчанию помечены звездочкой (*) и будут импортированы все элементы XML для перевода. Параметры импортировать можно использовать для изменить поведения импортировать.

Чат-боты искусственного интеллекта (ИИ) могут быть очень эффективными для выявления проблем формата в файлах на основе .XML.

Типы файлов

  • .XML

Импортировать параметры

Простые правила импорта

  • Элементы

    Импортируются только выбранные элементы (например, название, должность, параграф). Звездочка (*) импортирует все элементы.

  • Атрибуты

    Импортируются только выбранные атрибуты (например, имя, заголовок, параграф). Звездочка (*) импортирует все атрибуты.

  • Переводимые строковые элементы

    Если выбран параметр Автоматически определить строковые элементы, все элементы в переводимом тексте импортируются как переводимые строковые элементы.

  • Непереводимые строковые элементы

    Выбранные название, заголовок, пара строковых элементов будут преобразованы в tags, и контент не будет переводимым.

  • Автоматически определять строковые элементы

    Элементы, являющиеся соседями текстовых узлов, будут автоматически преобразованы в строковые tags.

  • Элементы (обрабатываются как HTML)

    Код выбранного элемента обрабатывается как .HTML. .Импортируемые настройки HTML, такие как Сохранить пробелы или тег разрыва (<br/>), создают новый сегмент.

    Используйте этот вариант, когда выбранное значение элемента содержит разметку .HTML. Он не применяется к дочерним структурам выбранного элемента, если не указано иное.

  • Заблокированные элементы

    Выбранные элементы будут импортированы как Заблокированные.

  • Заблокированные атрибуты

    Выбранные атрибуты будут импортированы как Заблокированные.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в tags. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Импортировать сущности XML

    Для перевода будут импортированы сущности XML в Декларации DTD.

  • Сегмент XML

    Отменить выбор, если сегментация не нужна.

  • Импорт комментариев

    Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Элементы (обрабатываются как HTML).

  • Преобразовать в теги системы Phrase TMS 

    Применить стандартные выражения, чтобы преобразовать указанный текст в tags.

  • Преобразование в символьные сущности

    Введите список ссылок на символы (через запятые) в файл результатов.

    Например:

    Если требуются кавычки ("), они будут представлены как &quot; , символ Σ будет представлен как &#x3A3; использовать &quot; ,&#x3A3; . &; и < всегда экспортируются соответственно как &amp; и &lt; .

Настройки XML с использованием XPath

Использование языка запросов XPath позволяет создавать сложные импортируемые правила и дополнительные функции, недоступные в обычных импортируемых правилах.

Выражение XPath должно определять элементы и/или свойства, текст/значение которых следует перевести, а не сам текстовый узел.

Перед использованием рекомендуется ознакомиться с XPath.

Контекстное примечание, Контекстный ключ и максимальная длина перевода не будут обработаны для файлов с более чем 10000 XML- элементов.

  • Контекстный ключ

    При необходимости представляет собой контекст памяти переводов (TM) (101 % совпадения).

  • Контекстное примечание

    Импортировать элементы или атрибуты контекста для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели Контекстных примечаний редактора. Любой символ, превышающий лимит, выделяется красным.

  • Не удалять пробелы

    Не empty для сохранения пробелов в элементах. Примените xml: whitespace= 'preserve'. // *, чтобы сохранить все пробелы во всех элементах, или используйте произвольное выражение XPath.

Предварительный просмотр HTML с таблицей стилей XSLT

Язык XSLT (Extensible Stylesheet Language Transformations) можно использовать для преобразования документов .XML в формат .HTML для контекстного предварительного просмотра. Соответственно, файлы предварительного просмотра, загруженные через перевод предварительного просмотра в меню Документ, имеют расширение HTML. В настоящее время phrase поддерживает XSLT 2.0.

Нажмите Выбрать файл, чтобы импортировать таблицу стилей.

Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импортированных файлов.

CDATA в XML файле

CDATA означает Данные символов и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Заданные сущности, такие как &lt; , &gt; и &gt; , требуют ввода и, как правило, трудно читаемы в разметке. В таких случаях можно использовать раздел CDATA.

Если CDATA содержит встроенный .HTML, соответствующие XML-элементы должны быть указаны в разделе Элементы (обрабатываются как HTML).

Если исходный файл содержит CDATA и используется сегмент XML, CDATA добавляется к каждому сегменту в «Завершено».

CDATA будет сегментирована только при наличии очищенного указания на разрыв сегмента, например, пунктуация или расстояние между сегментами.

Источник:

<text><![CDATA[Переводимый текст А. Переводимый текст Б.]]></text>

Перевод:

<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>

Завершенный файл действителен. XML, и программа просмотра XML верно отобразит текст в виде переводимого текста A. Переводимый текст B.

Параметры приложения

WordPress XML

Рекомендуемые настройки для WordPress XML:

  • XML

    XPath

  • Элементы и атрибуты

    //*[ local-name()='encoded']|/description|/title

  • Элементы (обрабатываются как HTML)

    //*[ local-name()='encoded']|/description|/title

  • Преобразовать в теги phrase tags

    (\[[^\]]++\])++

Выберите Сохранить пробелы в настройках HTML.

Многоязычные XML

Многоязычные файлы импортируются как задания с сопоставлением языков перед импортом. Они представлены с в таблице заданий. Завершенный файл импортируется на несколько языков перевода.

phrase поддерживает XML-файлы, в которых элементы оригинал и перевод присутствуют для всех абзацев, даже если перевод empty Когда оригинал и перевод сегментации отличаются, сегментация оригинала является определяющей.

Все отдельные элементы языка должны быть потомками одного и того же трансъединичного элемента, и один язык не может содержаться внутри другого. Оригинал и перевод контента не могут храниться в значениях атрибутов. Если несколько элементов совпадение с XPath для оригинал или перевод внутри трансъединичного элемента, для перевода импортируется только первый.

  • При создании задания выберите Многоязычный XML на панели «Тип файла» перед применением Параметров импорта. Если файл не указан, он будет импортирован в формате стандарта .XML.

  • Контент тегов исходника . XML файла можно увидеть в редакторе, нажав Expand tags в меню «Инструмент», и отредактировать, нажав F2.

Например:

Образец частично переведенного текста с английского на немецкий и французский языки. Все <tuv lang="en">, <tuv lang="de"> и <tuv lang="fr"> являются дочерними элементами одного <tu> элемента.

<?xml версия="1.0" кодировка="utf-8"?>
<root>
Не переводимый текст.
<tu note="контекстное примечание" ключ="Идентификатор 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Первый сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Сегмент Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="другое контекстное примечание" ключ="Идентификатор 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Второй сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Импортировать параметры

При импорте многоязычных файлов . XML необходимо использовать язык запроса XPath. Справочные файлы см. в примере выше. Выражение XPath определяет элементы, в которые следует перевести текст/значение, а не сам текстовый узел.

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    //tu

  • Элементы, содержащие исходный текст

    tuv[@lang='en']/seg (в отношении родительского элемента //tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='de']/seg (в отношении элемента арендной платы за контекстное примечание //tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='fr']/seg (в отношении родительского элемента //tu)

  • Непереводимые строковые элементы

    Все элементы в оригинал или перевод считаются переводимый строковыми элементами, если здесь не указаны как непереводимый строковые элементы.

  • Преобразовать в теги системы Phrase TMS 

    Применить стандартные выражения, чтобы преобразовать указанный текст в tags.

  • Контекстный ключ

    Укажите контекстный ключ, сохраненный вместе с сегментом в памяти переводов и используемый для контекста совпадения.

  • Контекстное примечание

    Импортировать элементы или атрибуты контекста для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента

  • Преобразование в символьные сущности

    Введите список ссылок на символы (через запятые) в файл результатов.

    Например:

    Если требуются кавычки ("), они будут представлены как &quot; , символ Σ будет представлен как &#x3A3; использовать &quot; ,&#x3A3; . &; и < всегда экспортируются соответственно как &amp; и &lt; .

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в tags. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Использовать подфильтр HTML 

    Импортирует HTML tags, содержащиеся в файле. Затем tags можно использовать с Настройками импортировать HTML-файлы. Теги Paragraph tags <p> создадут новые сегменты, даже если не выбран сегмент многоязычный XML.

  • Распределить по сегментам многоязычные XML

    Текст сегментируется по общему правилу сегментации, а не по одному сегменту на ячейку.

    Осторожность

    Применение многоязычного XML сегмента к файлу, содержащему текст перевода, может привести к тому, что количество сегментов в оригинале будет отличаться от числа сегментов в переводе.

  • Установить статус сегмента отсутствующего перевода 

    Выберите статус подтверждения по умолчанию и возможность автоматического добавления подтвержденных сегментов в память переводов (TM).

Пример:

Если многоязычный .XML содержит пространство имен, XPath может иметь следующий вид:

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    //*[ local-name()='trans-unit']

  • Элементы, содержащие исходный текст

    *[local-name()='source']

  • Элементы, содержащие текст перевода

    *[local-name()='target']

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.