Настройки импорта файла

.XML - Extensible Markup Language (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

формат файла .XML не предназначен для перевода и требует дополнительных настройки для успешного импортировать.

Настройки по умолчанию помечены звездочкой (*) и будут импортированы все элементы XML для перевода. Можно использовать параметры импортировать, чтобы изменить поведение импортируемых.

Чат-боты искусственного интеллекта (ИИ) могут очень эффективно выявлять проблемы формата в файлах на основе .XML.

Типы файлов

  • .XML

Параметры импорта

Простые импортируемые правила

  • Элементы

    Импортируются только выбранные элементы (например, название, должность, параграф). Звездочка (*) импортирует все элементы.

  • Атрибуты

    Импортируются только выбранные атрибуты (например, имя, должность, параграф). Звездочка (*) импортирует все атрибуты.

  • Переводимые строковые элементы

    Если выбран параметр «Автоматически определить строковые элементы», все элементы в переводимом тексте импортируются как переводимые строковые элементы.

  • Непереводимые строковые элементы

    Выбранные имя, название, пара строковых элементов будут преобразованы в tags, и контент не будет переводимым.

    ВАЖНО:

    Проблемы с tags являются распространенной причиной экспортируемых ошибок, особенно для таких типов файлов, как таблицы (на основе MS Excel) и .XML. Всегда проверяйте правильность tags и форматирования перед экспортом файлов, проводя проверку контроля качества.

  • Автоматически определять строковые элементы

    Элементы, являющиеся соседями текстовых узлов, будут автоматически преобразованы в строковые tags.

  • Элементы (обрабатываются как HTML)

    Код выбранного элемента обрабатывается как .HTML. Настройки импорта .HTML, такие как Сохранить пробелы или тег разрыва (<br/>), создают новый сегмент для этих элементов.

    Используйте этот параметр, если выбранное значение элемента содержит разметку .HTML. Он не применяется к дочерним элементам выбранного элемента, если не указано иное.

  • Заблокированные элементы

    Выбранные элементы будут импортированы как Заблокированные.

  • Заблокированные атрибуты

    Выбранные атрибуты будут импортированы как Заблокированные.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Импортировать сущности XML

    Сущности XML в Декларации DTD будут импортированы для перевода.

  • Сегментировать XML

    Снять выделение, если сегментация не нужна.

  • Импорт комментариев

    Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Элементы (обрабатываются как HTML).

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения, чтобы преобразовать указанный текст в теги.

  • Преобразование в символьные сущности

    Введите список ссылок на символы (через запятые) в файл результатов.

    Например:

    Если необходимы кавычки ("), они будут представлены как & quot; , символ Σ будет представлен как &#x3A3; использовать &quot; ,&#x3A3;. &; и < всегда экспортируются как &amp; и &lt; соответственно.

Настройки XML с использованием XPath

Использование языка запросов XPath позволяет создавать сложные импортируемые правила и некоторые дополнительные функции, недоступные в обычных импортируемых правилах.

Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых следует перевести, а не сам текстовый узел.

Перед использованием рекомендуется ознакомиться с XPath.

Контекстное примечание, контекстный ключ и максимальная длина перевода не будут обрабатываться для файлов с более чем 10 000 элементов XML.

  • Контекстный ключ

    Составляет контекст памяти переводов (TM) (101% совпадения), если это применимо.

  • Контекстное примечание

    Импортировать элементы или контекстные атрибуты для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели контекстных примечаний в редакторе. Любой символ, превышающий лимит, выделен красным цветом.

  • Не удалять пробелы

    Не empty для сохранения пробелов в элементах. Примените xml: whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или используйте произвольное выражение XPath.

Предварительный просмотр HTML с таблицей стилей XSLT

Язык XSLT (форматы расширяемых таблиц языков стиля) можно использовать для преобразования документов .XML в формат .HTML для целей контекстного предварительного просмотра. Соответственно, файлы предварительного просмотра, загруженные через перевод предварительного просмотра в меню Документ, имеют расширение HTML. Phrase в настоящее время поддерживает XSLT 2.0.

Нажмите «Выбрать файл», чтобы импортировать таблицу стилей.

Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импорта файла.

CDATA в файле XML

CDATA означает Данные символов и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Заданные сущности, такие как &lt; , &gt; и &amp; , требуют ввода текста и, как правило, их трудно прочесть в разметке. В таких случаях можно использовать раздел CDATA.

Если CDATA содержит встроенный .HTML, соответствующие элементы XML должны быть указаны в разделе Элементы (обрабатываются как HTML).

Если файл оригинала содержит CDATA и используется сегмент XML, CDATA добавляется к каждому сегменту в файле «Завершено».

CDATA будет сегментирована, только если есть очищенные признаки разрыва сегмента, такие как пунктуация или расстояние между сегментами.

Источник:

<text><![CDATA[Переводимый текст А. Переводимый текст В.]]></text>

Перевод:

<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>

Завершенный файл действителен .XML, и программа просмотра XML верно отобразит текст в виде переводимого текста A. Переводимый текст B.

Параметры приложения

WordPress XML

Рекомендуемые настройки WordPress XML:

  • XML

    XPath

  • Элементы и атрибуты

    ///*[local-name()='encoded']|/description|//title

  • Элементы (обрабатываются как HTML)

    ///*[local-name()='encoded']|/description|//title

  • Преобразовать в теги Phrase

    (\[[^\]]++\])++

Выберите Сохранить пробелы в настройках HTML.

Многоязычные XML

Многоязычные файлы импортируются как несколько двуязычных заданий с сопоставлением языков перед импортом. Они представлены multilingual_xml.png в таблице заданий. Завершенный файл будет импортирован на несколько языков перевода.

phrase поддерживает файлы XML, в которых элементы оригинал и перевод присутствуют для всех абзацев, даже если перевод empty При различии сегментации оригинала и перевода сегментация оригинала является определяющей.

Все отдельные элементы языка должны быть потомками одного и того же трансъединичного элемента, и один язык не может содержаться внутри другого. Оригинал и перевод контента не могут храниться в значениях атрибутов. При совпадении нескольких элементов с XPath для оригинала или перевода внутри элемента Trans- Unit на перевод импортируется только первый.

  • При создании задания выберите Многоязычный XML на панели «Тип файла», прежде чем применять Параметры импортировать. Если это не указано, файл будет импортирован в формате стандарта .XML.

  • Контент тегов исходника файла .XML можно просмотреть в редакторе, нажав Expand tags в меню «Инструмент», и отредактировать, нажав F2.

Например:

Образец частично переведенного текста с английского на немецкий и французский языки. Все <tuv lang="en">, <tuv lang="de"> и <tuv lang="fr"> являются дочерними элементами одного и того же <tu> элемента.

<?xml версия="1.0" кодировка="utf-8"?>
<root>
Не переводимый текст.
<tu note="контекстное примечание" ключ="Идентификатор 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Первый сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Сегмент Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="еще одно контекстное примечание" ключ="Идентификатор 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Второй сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Параметры импорта

Чтобы импортировать многоязычные файлы .XML, необходимо использовать язык запросов XPath. См. пример выше. Выражение XPath определяет элементы, в которые следует перевести текст/значение, а не сам текстовый узел.

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    //tu

  • Элементы, содержащие исходный текст

    tuv[@lang='en']/seg (в отношении родительского элемента //tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='de']/seg (в связи с элементом ренты в контекстном примечании pa/tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='fr']/seg (в отношении родительского элемента //tu)

  • Непереводимые строковые элементы

    Все элементы в оригинале или переводе считаются Переводимыми строковыми элементами, если они не указаны здесь как Непереводимые строковые элементы.

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения, чтобы преобразовать указанный текст в теги.

  • Контекстный ключ

    Укажите контекстный ключ, сохраненный вместе с сегментом в памяти переводов и используемый для совпадения контекста.

  • Контекстное примечание

    Импортировать элементы или контекстные атрибуты для каждого элемента.

  • Макс. длина сегмента в переводе

    Импортировать элементы или максимальную длину перевода для каждого элемента

  • Преобразование в символьные сущности

    Введите список ссылок на символы (через запятые) в файл результатов.

    Например:

    Если необходимы кавычки ("), они будут представлены как & quot; , символ Σ будет представлен как &#x3A3; использовать &quot; ,&#x3A3;. &; и < всегда экспортируются как &amp; и &lt; соответственно.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически конвертируются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Использовать подфильтр HTML 

    Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками Импортировать файлы HTML. Paragraph tags <p> создаст новые сегменты, даже если не выбран многоязычный XML сегмента.

  • Сегментировать многоязычный XML

    Текст сегментируется общим правилом сегментации, а не одним сегментом в клетке.

    Осторожно

    Применение многоязычного сегмента XML к файлу, содержащему текст перевода, может привести к тому, что количество сегментов в оригинале будет отличаться от количества сегментов в переводе.

  • Установить статус сегмента отсутствующего перевода 

    Выберите статус подтверждения по умолчанию и будет ли подтверждено сегментов автоматически добавлено в память переводов (TM).

Пример:

Если многоязычный .XML содержит пространство имен, то XPath может быть следующим:

  • Элементы, содержащие вложенные элементы исходного файла и файла перевода

    ///*[local-name()='trans-unit']

  • Элементы, содержащие исходный текст

    *[local-name()=' source']

  • Элементы, содержащие текст перевода

    *[ local-name()='перевод']

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.