Настройки импорта файла

.XML — расширяемый язык разметки (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Формат файла .XML не предназначен для перевода и требует дополнительных настроек для успешного импорта.

Параметры по умолчанию помечены звездочкой (*) и будут импортированы все элементы XML для перевода. Для изменения поведения импорта можно использовать параметры импорта.

Типы файлов

  • .XML

Варианты импорта

Правила импорта

  • Элементы

    Импортируются только выбранные элементы (т. е. название, заголовок, параграф). Звездочка (*) импортирует все элементы.

  • Атрибуты

    Импортируются только выбранные атрибуты (т. е. имя, название, параграф). Звездочка (*) импортирует все атрибуты.

  • Переводимые строковые элементы

    Если выбран параметр Автоматическое определение строковых элементов, все элементы в тексте перевода импортируются как переводимые строковые элементы.

  • Непереводимые строковые элементы

    Выбранные строковые элементы название, название, пара будут преобразованы в теги, и содержимое не будет переводиться.

  • Автоматически определить строковые элементы

    Элементы, являющиеся соседями текстовых узлов, будут автоматически преобразованы в строковые теги.

  • Элементы (обрабатываются как HTML)

    Код выбранного элемента обрабатывается как .HTML. Для этих элементов можно использовать настройки импорта .HTML, такие как Сохранить пробелы или тег разрыва (<br/>) создает новый сегмент.

  • Заблокированные элементы

    Выбранные элементы будут импортированы как закрытые.

  • Заблокированные свойства

    Выбранные атрибуты будут импортированы как Закрытые.

  • Разобрать сообщения ICU

    Сообщения ICU автоматически преобразуются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Импортировать сущности XML

    Для перевода будут импортированы сущности XML в Декларации DTD.

  • Сегмент XML

    Отменить выбор, если сегментация не нужна.

  • Импорт комментариев

    Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Элементы (обрабатываются как HTML).

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения для преобразования указанного текста в теги.

  • Преобразовать в символьные сущности

    Введите в выходной файл список ссылок на символы (через запятые).

    Пример:

    Если необходимы кавычки ("), они будут иметь вид " , символ Σ будет иметь вид Σ use " ,Σ. &; и < всегда экспортируются соответственно как & и < .

Настройки XML с использованием XPath

Использование языка запросов XPath позволяет создавать сложные правила импорта и некоторые дополнительные функции, недоступные в обычных правилах импорта.

Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых следует перевести, а не сам текстовый узел.

Перед использованием рекомендуется ознакомиться с XPath.

Контекстное примечание, Контекстный ключ и Максимальная длина перевода не будут обрабатываться для файлов с более чем 10000 элементов XML.

  • Контекстный ключ

    При необходимости представляет контекст памяти переводов (101% совпадения).

  • Контекстное примечание

    Импорт элементов или контекстных атрибутов для каждого элемента.

  • Максимальная длина перевода

    Импорт элементов или максимальная длина перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели Контекстные примечания в редакторе. Любой символ, превышающий лимит, выделен красным.

  • Сохранять пробелы

    Не заполнять для сохранения пробелов в элементах. Применить xml:whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или использовать произвольное представление XPath.

Предварительный просмотр HTML с таблицей стилей XSLT

Язык XSLT (Extensible Stylesheet Language Transformations) можно использовать для преобразования документов .XML в формат .HTML для целей контекстного предварительного просмотра. Соответственно, файлы предварительного просмотра, загруженные через перевод в меню Документ, имеют расширение HTML. В настоящее время Phrase поддерживает XSLT 2.0.

Нажмите Выбрать файл, чтобы импортировать таблицу стилей.

Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импорта файла.

CDATA в файле XML

CDATA означает Данные о символах и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Заданные сущности, такие как <, > и & , требуют ввода и, как правило, их трудно прочитать в разметке. В таких случаях можно использовать раздел CDATA.

Если CDATA содержит встроенный .HTML, соответствующие элементы XML должны быть перечислены в разделе Элементы (обрабатываются как HTML).

Если исходный файл содержит CDATA и используется сегмент XML, CDATA добавляется к каждому сегменту в «Завершенном файле».

CDATA будет сегментирована только при наличии четкого указания на разрыв сегмента, например пунктуации или интервала между сегментами.

Источник:

<text><![CDATA[Переводимый текст А. Переводимый текст В.]></text>

Перевод:

<text><![CDATA[Переводимый текст А.]><![CDATA[ ]]><![CDATA[Переводимый текст В.]></text>

Завершенный файл действителен .XML, и программа просмотра XML будет корректно отображать текст как Переводимый текст A. Переводимый текст B.

Параметры специфики приложения

Wordpress XML

Рекомендуемые настройки WordPress XML:

  • XML

    XPath

  • Элементы и свойства

    //*[local-name()='encoded']|/description|/title

  • Элементы (обрабатываются как HTML)

    //*[local-name()='encoded']|/description|/title

  • Преобразовать в теги Phrase

    (\[[^\]]++\])++

Выберите Сохранить пробелы в настройках HTML.

Многоязычные XML

Многоязычные файлы импортируются как несколько двуязычных заданий с сопоставлением языков перед импортом. В таблице заданий они представлены как multilingual_xml.png. При импорте на несколько языков перевода файл Completed состоит из всех языков перевода.

Phrase поддерживает файлы формата XML, в которых элементы исходника и перевода присутствуют для всех пунктов, даже если перевод пуст. Когда сегментация исходника и перевода отличается, сегментация исходника является определяющей.

Все отдельные языковые элементы должны быть потомками одного и того же трансъединичного элемента, и один язык не может содержаться внутри другого. Исходный контент и контент перевода не могут сохраняться в значениях атрибутов. Если несколько элементов совпадают с XPath для исходника или перевода внутри трансъединичного элемента, на перевод импортируется только первый.

  • При создании задания выберите Multilingual XML на вкладке Тип файла перед применением Параметры импорта. Если не указано, файл будет импортирован в стандартном формате .XML.

  • Теги исходного файла .XML можно увидеть в редакторе, нажав кнопку Развернуть теги в меню «Инструмент», а затем изменить их, нажав F2.

Пример:

Образец частично переведенного текста с английского на немецкий и французский языки. Все <tuv lang="en">, <tuv lang="de"> и <tuv lang="fr"> являются дочерними элементами одного <tu> элемента.

<?xml версия="1.0" кодировка="utf-8"?>
<root>
Непереводимый текст.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Первый сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="еще одно контекстное примечание" ключ="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Второй сегмент.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Варианты импорта

При импорте многоязычных файлов .XML необходимо использовать язык запроса XPath. См. пример выше для справки. Выражение XPath определяет элементы, в которые следует перевести текст/значение, а не сам текстовый узел.

  • Элементы, содержащие вложенные элементы исходника и перевода

    //tu

  • Элементы, содержащие исходный текст

    tuv[@lang='en']/seg (в отношении родительского элемента //tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='de']/seg (в отношении элемента аренды paContext note //tu)

  • Элементы, содержащие текст перевода

    tuv[@lang='fr']/seg (в отношении родительского элемента //tu)

  • Непереводимые строковые элементы

    Все элементы в исходнике или переводе считаются Переводимыми строковыми элементами, если они не указаны здесь в качестве непереводимых строковых элементов.

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения для преобразования указанного текста в теги.

  • Контекстный ключ

    Укажите контекстный ключ, сохраненный вместе с сегментом в памяти переводов и используемый для контекста совпадения.

  • Контекстное примечание

    Импорт элементов или контекстных атрибутов для каждого элемента.

  • Максимальная длина перевода

    Импорт элементов или максимальная длина перевода для каждого элемента

  • Преобразовать в символьные сущности

    Введите в выходной файл список ссылок на символы (через запятые).

    Пример:

    Если необходимы кавычки ("), они будут иметь вид " , символ Σ будет иметь вид Σ use " ,Σ. &; и < всегда экспортируются соответственно как & и < .

  • Разобрать сообщения ICU

    Сообщения ICU автоматически преобразуются в теги. Файлы с сообщениями ICU не могут содержать строковые элементы.

  • Использовать подфильтр HTML 

    Импортирует теги HTML, содержащиеся в файле. Теги затем можно использовать с настройками импорта HTML-файлов. Теги абзаца <p> будут создавать новые сегменты, даже если не выбран сегмент многоязычный XML.

  • Сегментировать многоязыковой XML

    Текст сегментируется по общему правилу сегментации, а не по одному сегменту в ячейке.

    Осторожно

    Применение многоязычного сегмента XML к файлу, содержащему текст перевода, может привести к иному количеству сегментов в исходнике, чем в переводе.

  • Задать статус сегмента непустой цели 

    Выберите статус подтверждения по умолчанию и автоматически ли подтвержденные сегменты добавлены в ТМ.

Пример:

Если многоязычный .XML содержит пространство имен, XPath может иметь следующий вид:

  • Элементы, содержащие вложенные элементы исходника и перевода

    //*[local-name()='trans-unit']

  • Элементы, содержащие исходный текст

    *[local-name()='source']

  • Элементы, содержащие текст перевода

    *[local-name()='target']

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.