Формат файла .XML не предназначен для перевода и требует дополнительных настроек для успешного импорта.
Настройки по умолчанию отмечены звездочкой (*) и будут импортировать все элементы XML для перевода. Опции импорта могут быть использованы для изменения поведения импорта.
Сервисы ИИ могут быть очень эффективными в выявлении проблем с форматом в файлах на основе .XML.
Типы файлов
-
.XML
Параметры импорта
Простые правила импорта
-
Импортируются только выбранные элементы (т.е. имя, заголовок, параграф). Звездочка () импортирует все элементы.
-
Импортируются только выбранные атрибуты (т.е. имя, заголовок, параграф). Звездочка () импортирует все атрибуты.
-
Если выбрана опция , все элементы в переводимом тексте импортируются как Переводимые строковые элементы.
-
Выбранный строковый элемент имя, заголовок, параграф будет преобразован в теги, и контент не будет переводимым.
Важно
Проблемы с тегами являются распространенной причиной ошибок экспорта (например, ), особенно для таких типов файлов, как таблицы (на основе MS Excel) и .XML. Всегда убедитесь, что теги и форматирование правильные перед экспортом файлов, проводя проверки контроля качества.
-
Элементы, которые являются соседями текстовых узлов, будут автоматически преобразованы в строковые теги.
-
Код выбранного элемента обрабатывается как .HTML. Настройки импорта .HTML, такие как Сохранить пробелы или Тег разрыва (<br/>) создает новый сегмент, могут быть использованы для этих элементов.
Используйте эту опцию, когда значение выбранного элемента содержит разметку .HTML. Это не применяется к дочерним элементам выбранного элемента, если не указано иное.
-
Выбранные элементы будут импортированы как Заблокированный.
-
Выбранные атрибуты будут импортированы как Заблокированный.
-
Введите список ссылок на символы (разделенных запятыми) в выходной файл.
Например:
-
Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
-
Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, парсинг ICU для этого сегмента пропускается. Сегменты без встроенных элементов обрабатываются нормально.
-
XML-сущности в DTD Declaration будут импортированы для перевода.
-
-
Комментарии не импортируются, если элементы обрабатываются как HTML, как указано в опции Elements (processed as HTML).
-
Выберите, чтобы предотвратить сегментацию внутри парных тегов XML или подс элементов. Это полезно, если XML содержит вложенные структуры, где сегментация нарушила бы логическое значение текста.
-
Файл стиля .XSL можно загрузить и сгенерировать читаемый файл предварительного просмотра из него.
XML настройки с использованием XPath
Использование языка запросов XPath позволяет создавать сложные правила импорта и некоторые дополнительные функции, недоступные в обычных правилах импорта.
Выражение XPath должно определять элементы и/или атрибуты, текст/значение которых должно быть переведено, а не фактический текстовый узел.
Рекомендуется ознакомиться с XPath перед использованием.
, и не будут обрабатываться для файлов с более чем 10 000 XML-элементов.
-
Составляет контекст памяти переводов (TM) (101% совпадения), если это применимо.
-
Импортируйте элементы или контекстные атрибуты для каждого элемента.
-
Импортировать элементы или максимальную длину перевода для каждого элемента. Ограничение количества символов для каждого сегмента отображается на панели в редакторе. Любой символ, превышающий лимит, выделен красным цветом.
-
Оставьте пустым, чтобы сохранить пробелы в элементах. Примените xml:whitespace='preserve'. //*, чтобы сохранить все пробелы во всех элементах, или используйте произвольное выражение XPath.
-
Укажите XML-элементы или атрибуты, которые не должны быть сегментированы. Введите выражение XPath, которое определяет узлы, которые следует исключить. Любой текст, извлеченный из этих узлов, будет сохранен как один сегмент, а не разделен на более мелкие единицы.
Введите //element[@attr='value'], чтобы исключить все
<element>узлы, содержащие атрибутattr="value"из сегментации.
HTML предварительный просмотр с XSLT таблицей стилей
Язык XSLT (Расширяемый язык преобразования таблиц стилей) может использоваться для преобразования .XML документов в .HTML формат для предварительного просмотра в контексте. Соответственно, файлы предварительного просмотра, загруженные через Предварительный просмотр перевода в меню Документ, имеют расширение HTML. Фраза в настоящее время поддерживает XSLT 2.0.
XSLT, используемый для предварительного просмотра, должен основываться на целевом, а не исходном.
Нажмите Выбрать файл, чтобы импортировать таблицу стилей.
Нажмите Скачать XSLT, чтобы скачать таблицу стилей после импорта файла.
CDATA в XML файле
CDATA означает Символьные данные и определяется как блоки текста, которые не обрабатываются парсером, но распознаются как разметка. Предопределенные сущности, такие как <, >, и & требуют ввода и, как правило, трудно читаемы в разметке. В таких случаях можно использовать секцию CDATA.
Если CDATA содержит встроенный .HTML, соответствующие XML элементы должны быть перечислены под .
Если исходный файл содержит CDATA и используется , то CDATA добавляется к каждому сегменту в завершенном файле.
CDATA будет сегментироваться только в том случае, если есть четкое указание на разрыв сегмента, такое как пунктуация или пробел.
Исходный:
<text><![CDATA[Переводимый текст A. Переводимый текст B.]]></text>
Целевой:
<text><![CDATA[Переводимый текст A.]]><![CDATA[ ]]><![CDATA[Переводимый текст B.]]></text>
Завершенный файл является действительным .XML, и XML просмотрщик будет правильно отображать текст как Переводимый текст A. Переводимый текст B.
Многоязычные файлы импортируются как несколько двуязычных заданий с языками, сопоставленными перед импортом. Они представлены как в таблице задания. Если импортировано на несколько целевых языков, файл Завершено состоит из всех целевых языков.
Фраза поддерживает XML файлы, в которых присутствуют как исходные, так и целевые элементы для всех абзацев, даже если целевой элемент пуст. Когда сегментация исходного и целевого языков различна, сегментация исходного языка является определяющей.
Индивидуальные языковые элементы должны быть потомками одного и того же элемента trans-unit, и один язык не может содержаться в другом. Содержимое исходного и целевого языков не может храниться в значениях атрибутов. Если несколько элементов соответствуют XPath для исходного или целевого языков внутри элемента trans-unit, только первый из них импортируется для перевода.
-
При создании задания выберите в панели перед применением параметров импорта. Если не указано иное, файл будет импортирован как стандартный .XML.
-
Содержимое тегов исходного .XML файла можно визуализировать в редакторе, нажав Развернуть теги в меню и редактировать, нажав F2.
Например:
Пример частично переведенного текста с английского на немецкий и французский. Все <tuv lang="en">, <tuv lang="de"> и <tuv lang="fr"> являются дочерними элементами одного и того же <tu> элемента.
<?xml version="1.0" encoding="utf-8"?>
<root>
Не переводимый текст.
<tu note="контекстное примечание" key="Идентификатор 254" maxlen="16">
<tuv lang="ru">
<seg>Первый сегмент.</seg>
</tuv>
<tuv lang="de">
<seg>Erste segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="другое контекстное примечание" key="Идентификатор 255" maxlen="18">
<tuv lang="ru">
<seg>Второй сегмент.</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
Параметры импорта
Для импорта многоязычных .XML файлов необходимо использовать язык запросов XPath. Смотрите пример выше для справки. Выражение XPath определяет элементы, в которых текст/значение должно быть переведено, а не фактический текстовый узел.
-
//tu -
tuv[@lang='ru']/seg(в отношении родительского элемента//tu) -
Все элементы в источнике или цели считаются переводимыми встроенными элементами, если не указано иное как непереводимые встроенные элементы.
-
Укажите контекстный ключ, который сохраняется с сегментом в памяти переводов и используется для контекста совпадения.
-
Импортируйте элементы или контекстные атрибуты для каждого элемента.
-
Импортировать элементы или максимальную длину перевода для каждого элемента
-
Введите список ссылок на символы (разделенных запятыми) в выходной файл.
Например:
-
Применить регулярные выражения, чтобы преобразовать указанный текст в теги.
-
Сообщения ICU автоматически конвертируются в теги. Когда сегмент содержит встроенные элементы, парсинг ICU для этого сегмента пропускается. Сегменты без встроенных элементов обрабатываются нормально.
-
Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML. Теги абзацев
<p>создадут новые сегменты, даже если не выбран. -
Импортируются HTML теги, содержащиеся в файле. Далее теги можно использовать с настройками импорта файлов HTML.
-
Текст сегментируется по общей правиле сегментации, а не по одному сегменту на ячейку.
Осторожно
Применение к файлу, содержащему целевой текст, может привести к различному количеству сегментов в источнике и в цели.
-
Выберите статус подтверждения по умолчанию и то, будут ли подтвержденные сегменты автоматически добавлены в TM.
-
Файл стиля .XSL можно загрузить и сгенерировать читаемый файл предварительного просмотра из него.
Пример: