该.XML 文件格式不是为翻译而设计的,需要其他设置才能成功导入。
默认设置标有星号 (*),并将导入所有 XML 元素进行翻译。导入选项可用于更改导入行为。
文件类型
-
.XML
导入选项
普通导入规则
-
仅导入已选择元素(即名称、标题、段落)。星号 ( ) 导入所有元素。
-
仅导入已选择属性(即名称、标题、段落)。星号 ( ) 导入所有属性。
-
如果已选择“自动 识别内联元素”选项,则可翻译文本中的所有元素都将作为可译的内联元素导入。
-
选定的行内元素 名称、标题、段落 将转换为标记,内容将无法翻译。
-
作为文本节点相邻元素的元素将自动转换为内联标记。
-
选定的元素代码将作为.HTML进行处理。HTML 导入设置 (如 “保留空格 ”或 “中断标记”(<br/>))创建可用于这些元素新建 句段 。
-
已选择元素将作为锁定导入 。
-
已选择属性将作为锁定导入 。
-
ICU 消息会自动转换为 标记。包含 ICU 消息的文件不能包含任何内联元素。
-
将导入 DTP 声明 中的 XML 实体进行翻译。
-
如果不需要分段,请取消选择。
-
如果元素按照“ 元素(处理为 HTML) ”选项中的指示作为 HTML 进行处理,则不会导入备注。
-
-
在输出文件中输入字符引用列表(以逗号分隔)。
例:
使用 XPath 的 XML 设置
使用 XPath 查询语言 可以创建复杂的导入规则和一些普通导入规则中不可用的附加功能。
XPath 表达式应定义应翻译其文本/值的元素和/或属性,而不是实际的文本节点。
建议在使用前熟悉 XPath。
对于包含超过 10,000 个 XML 元素的文件,将不会处理上下文注释, 、上下文键和最大译文长度。
-
构成翻译记忆库 上下文(101% 匹配)(如适用)。
-
导入元素或为每个元素上下文属性。
-
导入元素或每个元素的最大译文长度。每个句段的字符限制显示在 窗格中。任何超出限制的字符都以红色突出显示。
-
留空以保留元素中的空格。应用 xml:whitespace='preserve'. //* 保留所有元素中的所有空格,或使用任意 XPath 表达式。
使用 XSLT 样式表进行 HTML 预览
XSLT 语言(可扩展样式表语言转换)可用于将.XML文档转换为.HTML格式,以便 进行上下文预览 。因此,通过“文档 ” 菜单中的预览翻译 已下载 的预览文件带有HTML扩展名。Phrase 目前支持 XSLT 2.0。
单击“选择文件 ” 以导入样式表。
单击“ 下载 XSLT ”以在文件 导入后下载样式表。
XML 文件中的 CDATA
CDATA 表示字符数据,定义为不由解析器处理但被识别为标记的文本块。预定义实体(如 <、
>
, 和 &
)需要键入,并且通常难以在标记中读取。在这种情况下,可以使用 CDATA 部分。
如果 CDATA 包含嵌入的.HTML,则应在“元素(处理为 HTML)”下列出
如果源文件包含 CDATA 并且
,则 CDATA 将已添加到已完成文件中的每个句段。仅当有清空指示句段符(如标点符号或空格)时,才会对 CDATA 进行分段。
源:
<文本><![CDATA[可译的文本 A. 可译的文本 B.]]></文本>
目标:
<文本><![CDATA[可翻译文本 A.]]><![CDATA[ ]]><![CDATA[可翻译文本 B.]]></文本>
“已完成”文件.XML有效,XML 查看器会将文本正确 显示为可译的文本 A. 可译的文本 B。
多语言文件作为多个双语作业导入,并在导入之前映射语言。它们在作业表中用multilingual_xml.png alt表示alt
。如果导入到多种目标语言, 则“已完成” 文件由所有目标语言组成。
Phrase 支持在所有段落中同时存在原文和译文元素的 XML 文件,即使译文为空也是如此。当原文和目标分割不同时,源分割是确定的。
单个语言元素必须都是同一跨单元元素的后代,并且一个语言不能包含在另一个元素中。源和译文 内容不能存储在属性值中。如果多个元素匹配 XPath for 原文或 trans-unit 元素内的译文,则仅导入第一个元素进行翻译。
-
创建工作, 时 ,请先从“ ”窗格中选择 ”,然后再应用“导入选项”。如果未指定,文件将作为标准.XML导入。
-
原文 .XML 文件的标记内容可以通过单击“工具 ”菜单下的
”在编辑器中可视化,并通过单击 F2 进行编辑。
例:
从英语到德语和法语的部分翻译文本样本。所有
元素的子 <tuv lang=“en”>、<tuv lang=“de”>和<tuv lang=“fr”>都是同一<tu>
, 元素。
<?xml version="1.0" encoding="utf-8"?>
<root>
不可翻译的文本。
<tu note="context note" key="ID 254" maxlen="16">
<tuv lang="en">
<seg>First segment.</seg>
</tuv>
<tuv lang="de">
<seg>Erste 句段</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note=“other 上下文注释” key=“ID 255” maxlen=“18”>
<tuv lang="en">
<赛格>第二段.</赛格>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
导入选项
对于多语言.XML文件的导入, 必须使用 XPath 查询语言。有关参考,请参阅上面的示例。XPath 表达式定义应在其中翻译文本/值的元素,而不是实际的文本节点。
-
//tu
-
tuv[@lang='en']/seg
(相对于父元素//tu
) -
tuv[@lang='de']/seg
(与 pa 租金元素//tu
有关) -
tuv[@lang='fr']/seg
(相对于父元素//tu
) -
原文或译文中的所有元素都被视为可译的内联元素,除非此处指定为非译元素内联元素。
-
应用正则表达式 将 指定的文本转换为标记。
-
指定与句段 一起已保存翻译记忆库 并用于匹配 上下文的上下文键。
-
导入元素或为每个元素上下文属性。
-
导入元素或每个元素的最大译文长度
在输出文件中输入字符引用列表(以逗号分隔)。
例:
-
ICU 消息会自动转换为 标记。包含 ICU 消息的文件不能包含任何内联元素。
导入文件中包含的 HTML 标记。然后,可以将标记与 HTML 文件导入设置一起使用。即使未选择分段多语言 XML ,第 标记 段 <p> 也会
-
文本按常规 分割规则 进行分段,而不是每个单元格一个句段。
谨慎
将段多语言 XML 应用于
-
选择 默认确认状态以及是否自动已添加已确认 句段翻译记忆库。
示例: