.XML 文件格式不是为翻译设计的,需要额外设置才能成功导入。
默认设置以星号 (*) 标记,并将导入所有 XML 元素进行翻译。导入选项使用至更改导入行为。
文件类型
-
.XML
导入选项
普通导入规则
-
仅导入选择的元素(即名称、标题、段)。星号( )导入所有元素。
-
仅导入选择的属性(即名称、标题、段)。星号( )导入所有属性。
-
如果选择了可译的行内元素导入。
选项,可译的文本中的所有元素都将作为 -
已选择的行内元素名称、标题、段将被转换为标记,内容是不可译的。
-
与文本节点相邻的元素将自动转换为行内标记。
-
已选择的元素代码作为 .HTML 处理。.HTML 导入设置,例如保留空格或中断标记 (<br/>) 创建新句段可用于这些元素。
-
选择的元素将作为已锁定导入。
-
选择的属性将作为已锁定导入。
-
ICU 信息自动转换为标记。带有 ICU 信息的文件不能包含任何行内元素。
-
将导入 DTP 声明中的 XML 实体进行翻译。
-
如果不需要断句,请取消选择。
-
如果按元素(处理为 HTML)选项所示将元素处理为 HTML,则不会导入备注。
-
应用正则表达式将指定文本转换为标记。
-
在输出文件中输入字符参考列表(以逗号分隔)。
示例:
使用 XPath 的 XML 设置
使用XPath查询语言可以创建复杂的导入规则和普通导入规则没有的一些附加功能。
XPath 表达式应定义其文本/值应被翻译的元素和/或属性,而不是实际的文本节点。
建议在使用之前熟悉 XPath。
XML 元素超过 10,000 个的文件不会处理
、 和 。-
如果适用,则构成翻译上下文01 匹配)。
-
为每个元素导入元素或上下属性。
-
导入元素或每个元素的最大译文长度。每个句段的字符限制显示在编辑器内的窗格中。任何超出限制的字符都将以红色突出显示。
-
留空至元素中保留空格。应用xml:空格='preserve'。//*保留所有元素中的所有空格,或使用任意的XPath表达式。
使用 XSLT 样式表预览 HTML
可使用 XSLT 语言(可扩展样式表语言转换)将 .XML 文档转换为 .HTML 表格进行上下文预览。因此,通过文件菜单中的预览翻译下载的预览文件带有HTML扩展名。Phrase 目前支持 XSLT 2.0。
单击选择文件导入样式表。
文件导入后单击下载XSLT至下载样式表。
CDATA 格式 XML 文件
CDATA 意为字符数据,定义为不由解析器处理但被识别为标记的文本块。预定义的实体,例如 <、
>
和 &
需要输入,通常在标记中难以读取。在这种情况下,可以使用 CDATA 部分。
如果 CDATA 包含嵌入的 .HTML,则应在
下列出相应的 XML 元素。如果源文件包含 CDATA 并且使用了
,则 CDATA 已添加至已完成文件中的每一句段。CDATA 只有在标点或空格等句段被清空的情况下才会被句段。
原文:
<text><![CDATA[可译文本 A. 可译文本 B.]]></text>
译文:
<应税供应><![CDATA[可译应税供应A.]]><![CDATA[ ]]><![CDATA[可译应税供应B.]]></应税供应
已完成文件是有效的.XML,XML查看器会将文本正确显示为可译的文本A。可译的文本B。
多语言文件作为多个双语工作导入,并在导入前映射语言。它们在工作选项卡中用表示。如果导入几种目标语言,已完成文件包括所有目标语言。
Phrase 支持所有段落都包含原文和译文元素的 XML 文件,即使译文为空。原文句段和译文句段不同时,以原文句段为准。
单个语言元素必须都是同一跨单位元素的后代,并且一种语言不能包含在另一种语言中。原文和译文内容不能存储在属性值中。如果跨单元元素中有多个元素与原文或译文的 XPath 匹配,则仅导入第一个元素进行翻译。
-
创建工作时,在应用导入选项之前从 窗格选择 。如果未指定,文件将作为标准 .XML 导入。
-
单击展开标记可在编辑器中可视化原文 .XML 文件的标记内容,然后单击F2进行编辑。
菜单下的
示例:
从英语至德语和法语的部分翻译文本样本。所有 <tuv lang="en">
、<tuv lang="de">
和 <tuv lang="fr">
都是同一 <tu>
元素的子元素。
<?xml version="1.0" encoding="utf-8"?> <root> 不是可译的文本。 <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>第一句段。</seg> </tuv> <tuv lang="de"> <seg>Erste 句段> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu 注释" another 上下文注释" key="id 255" maxlen="18"> <tuv lang="en"> <seg>第二句段。</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
导入选项
要导入多语言 .XML 文件,必须使用 XPath 查询语言。见上文示例以供参考。XPath 表达式定义了应翻译文本/值的元素,而不是实际的文本节点。
-
//tu
-
tuv[@lang='en']/seg
(相对于父元素//tu
) -
tuv[@lang='de']/seg
(至pa 租金元素//tu
) -
tuv[@lang='fr']/seg
(相对于父元素//tu
) -
除非此处指定为非译元素元素,否则原文或译文中的所有元素都被视为可行内元素元素内行内元素。
-
应用正则表达式将指定文本转换为标记。
-
指定与句段一起保存至翻译记忆库并用于匹配上下文的上下文键。
-
为每个元素导入元素或上下属性。
-
导入元素或每个元素的最大译文长度
-
在输出文件中输入字符参考列表(以逗号分隔)。
示例:
-
ICU 信息自动转换为标记。带有 ICU 信息的文件不能包含任何行内元素。
-
导入文件中包含的 HTML 标记。然后,标记可以与 HTML 文件导入设置一起使用。段落标记
<p>
将新建句段,即使未选择 。 -
文本按一般断句规则句段,而不是每个单元格一句段。
注意事项
将
应用至包含目标文本的文件可能会导致原文与译文的句段数字不同。 -
选择默认确认状态和已已确认句段是否自动已添加至翻译记忆翻译记忆库。
示例: