文件导入设置

.XML —— 可扩展标记语言 (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

.XML 文件格式不是为翻译设计的,需要额外设置才能成功导入。

默认设置以星号 (*) 标记,并将导入所有 XML 元素进行翻译。导入选项可用于更改导入行为。

文件类型

  • .XML

导入选项

普通导入规则

  • 元素

    仅导入选定的元素(即名称、标题、段)。星号(*)导入所有元素。

  • 属性

    仅导入选定的属性(即名称、标题、段)。星号(*)导入所有属性。

  • 可译行内元素

    如果选择了自动标识行内元素 选项,可译文本中的所有元素都将作为可译行内元素导入。

  • 不可译行内元素

    选定的行内元素名称、标题、段落将转换为标记,并且内容不可译。

  • 自动识别行内元素

    文本节点相邻的元素将自动转换为行内标记。

  • 元素(作为 HTML 处理)

    选定的元素代码作为 .HTML 处理。.HTML 导入设置,例如保留空格换行符 (<br/>) 创建新句段,可用于这些元素。

  • 锁定元素

    选定的元素将被导入为已锁定

  • 锁定属性

    所选属性将作为已锁定导入。

  • 解析 ICU 信息

    ICU 信息会自动转换为标记。带有 ICU 消息的文件不能包含任何行内元素。

  • 导入 XML 实体

    DTD 声明中的 XML 实体将被导入进行翻译。

  • Segment XML

    如果不需要分段,请取消选择。

  • 导入备注

    如果按元素(处理为 HTML)选项所示将元素处理为 HTML,则不会导入备注。

  • 转换为 Phrase TMS 标记 

    应用正则表达式将指定文本转换为标记。

  • 转换为字符实体

    在输出文件中输入字符参考列表(以逗号分隔)。

    示例:

    如果需要引号(”),它们将被表示为 ",字符 Σ 将被表示为 Σ use ",Σ . & 并且总是分别被导出为 &<

使用 XPath 的 XML 设置

使用 XPath 查询语言可以创建复杂的导入规则和普通导入规则没有的一些附加功能。

XPath 表达式应定义其文本/值应被翻译的元素和/或属性,而不是实际的文本节点。

建议在使用之前熟悉 XPath。

对于 XML 元素超过 10,000 个的文件,将不会处理上下文注释上下文键译文最大长度

  • 上下文键

    如果适用,则构成翻译记忆库上下文(101 %匹配)。

  • 上下文注释

    为每个元素导入元素或上下文属性。

  • 译文长度最大值

    导入元素或每个元素的最大译文长度。每个句段的字符限制显示在编辑器内的上下文注释窗格中。任何超出限制的字符都将以红色突出显示。

  • 保留空格

    留空以在元素中保留空格。应用 xml:whitespace='preserve'. //* 在所有元素中保留所有空格,或使用任意 XPath 表达式。

使用 XSLT 样式表预览 HTML

XSLT 语言(可扩展样式表语言转换)可用于将 .XML 文档转换为 .HTML 格式以实现上下文预览。因此,通过文档菜单中的预览翻译下载的预览文件带有HTML扩展名。Phrase 目前支持 XSLT 2.0。

单击选择文件导入样式表。

文件导入后,单击下载 XSLT 下载样式表。

CDATA 格式 XML 文件

CDATA 意为字符数据,定义为不由解析器处理但被识别为标记的文本块。预定义的实体,例如 <、 >& 需要键入,通常在标记中难以读取。在这种情况下,可以使用 CDATA 部分。

如果 CDATA 包含嵌入的 .HTML,则相应的 XML 元素应列在元素(处理为 HTML)下。

如果源文件包含 CDATA 并且使用了句段 XML,则 CDATA 将被添加到已完成文件中的每个句段。

CDATA 只有在标点或间距等句段断句处有明确指示时才会被分段。

原文:

<text><![CDATA[可译文本 A. 可译文本 B.]]></text>

译文:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

已完成文件是有效的 .XML,XML 查看器会将文本正确显示为可译文本 A。可译文本 B。

应用程序特定设置

Wordpress XML

Wordpress XML 推荐设置:

  • XML

    XPath

  • 元素和属性

    //*[local-name()='encoded']|//description|//title

  • 元素(作为 HTML 处理)

    //*[local-name()='encoded']|//description|//title

  • 转换为 Phrase 标记

    (\[[^\]]++\])++

HTML 设置下选择保留空格

Multilingual XML

多语言文件作为多个双语工作导入,并在导入前映射语言。它们在工作表中用 multilingual_xml.png 表示。如果导入多个目标语言,则已完成的文件包括所有目标语言。

Phrase 支持所有段落都包含源元素和目标元素的 XML 文件,即使译文为空。当源句段和目标句段不同时,由源句段决定。

单个语言元素必须都是同一跨单位元素的后代,并且一种语言不能包含在另一种语言中。原文和目标内容不能存储在属性值中。如果跨单元元素中有多个元素与原文或译文的 XPath 匹配,则仅导入第一个元素进行翻译。

  • 创建工作时,请在应用导入选项之前从文件类型窗格中选择多语言 XML。如果未指定,文件将作为标准 .XML 导入。

  • 源 .XML 文件的标记内容可以在编辑器中通过单击工具菜单下的展开标记可视化,并通过单击F2编辑。

示例:

从英语到德语和法语的部分翻译文本样本。所有 <tuv lang="en"><tuv lang="de"><tuv lang="fr"> 都是同一 <tu> 元素的子元素。

<?xml version="1.0" encoding="utf-8"?>
<root>
不是可译文本。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>第一个句段。</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste 句段</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note=" another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>第二句段。</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

导入选项

要导入 Multilingual .XML 文件,必须使用 XPath 查询语言。参考上面的例子。XPath 表达式定义了应翻译文本/值的元素,而不是实际的文本节点。

  • 包含源元素和目标子元素的元素

    //tu

  • 包含原文的元素

    tuv[@lang='en']/seg(相对于父元素//tu

  • 包含目标文本的元素

    tuv[@lang='de']/seg(关于pa上下文注释租金元素//tu

  • 包含目标文本的元素

    tuv[@lang='fr']/seg(相对于父元素//tu

  • 不可译行内元素

    除非此处指定为非译元素,否则原文或译文中的所有元素都被视为可译行内元素。

  • 转换为 Phrase TMS 标记 

    应用正则表达式将指定文本转换为标记。

  • 上下文键

    指定与句段一起保存到翻译记忆库并用于匹配上下文的上下文键。

  • 上下文注释

    为每个元素导入元素或上下文属性。

  • 译文长度最大值

    导入元素或每个元素的最大译文长度

  • 转换为字符实体

    在输出文件中输入字符参考列表(以逗号分隔)。

    示例:

    如果需要引号(”),它们将被表示为 ",字符 Σ 将被表示为 Σ use ",Σ . & 并且总是分别被导出为 &<

  • 解析 ICU 信息

    ICU 信息会自动转换为标记。带有 ICU 消息的文件不能包含任何行内元素。

  • 使用 HTML 子过滤器 

    导入文件中包含的 HTML 标记。然后,标记可以与 HTML 文件导入设置一起使用。即使未选择句段 Multilingual XML,段落标记 <p> 也会创建新句段。

  • 分割多语言 XML

    文本由一般句段规则分割,而不是每个单元格一个句段。

    注意事项

    句段多语言 XML 应用于包含目标文本的文件可能会导致原文中的句段数与目标中的句段数不同。

  • 设置非空译文的句段状态 

    选择默认确认状态和已确认句段是否自动添加到翻译记忆库。

示例

如果多语言 .XML 包含命名空间,XPath 可以是以下:

  • 包含源元素和目标子元素的元素

    //*[local-name()='trans-unit']

  • 包含原文的元素

    *[local-name()='source']

  • 包含目标文本的元素

    *[local-name()='target']

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.