文件导入设置

.XML - 可扩展标记语言(TMS)

文本由 Phrase Translate 机器翻译。

该.XML 文件格式不是为翻译而设计的,需要其他设置才能成功导入。

默认设置标有星号 (*),并将导入所有 XML 元素进行翻译。导入选项可用于更改导入行为。

文件类型

  • .XML

导入选项

普通导入规则

使用 XPath 的 XML 设置

使用 XPath 查询语言 可以创建复杂的导入规则和一些普通导入规则中不可用的附加功能。

XPath 表达式应定义应翻译其文本/值的元素和/或属性,而不是实际的文本节点。

建议在使用前熟悉 XPath。

对于包含超过 10,000 个 XML 元素的文件,将不会处理上下文注释, 、上下文键和最大译文长度。 ,

  • 上下文键

    构成翻译记忆库 上下文(101% 匹配)(如适用)。

  • 上下文说明

    导入元素或为每个元素上下文属性。

  • 最大译文长度

    导入元素或每个元素的最大译文长度。每个句段的字符限制显示在 编辑器内的上下文注释 窗格中。任何超出限制的字符都以红色突出显示。

  • 保留空格

    留空以保留元素中的空格。应用 xml:whitespace='preserve'. //* 保留所有元素中的所有空格,或使用任意 XPath 表达式。

使用 XSLT 样式表进行 HTML 预览

XSLT 语言(可扩展样式表语言转换)可用于将.XML文档转换为.HTML格式,以便 进行上下文预览 。因此,通过“文档菜单中的预览翻译 已下载 的预览文件带有HTML扩展名。Phrase 目前支持 XSLT 2.0。

单击“选择文件 ” 以导入样式表。

单击“ 下载 XSLT ”以在文件 导入后下载样式表。

XML 文件中的 CDATA

CDATA 表示字符数据,定义为不由解析器处理但被识别为标记的文本块。预定义实体(如 <、 >, 和 & )需要键入,并且通常难以在标记中读取。在这种情况下,可以使用 CDATA 部分。

如果 CDATA 包含嵌入的.HTML,则应在“元素(处理为 HTML)”下列出 相应的 XML 元素。

如果源文件包含 CDATA 并且 使用了段 XML ,则 CDATA 将已添加到已完成文件中的每个句段。

仅当有清空指示句段符(如标点符号或空格)时,才会对 CDATA 进行分段。

源:

<文本><![CDATA[可译的文本 A. 可译的文本 B.]]></文本>

目标:

<文本><![CDATA[可翻译文本 A.]]><![CDATA[ ]]><![CDATA[可翻译文本 B.]]></文本>

“已完成”文件.XML有效,XML 查看器会将文本正确 显示为可译的文本 A. 可译的文本 B

特定应用设置

Wordpress XML

Wordpress XML 的推荐设置:

  • XML

    XPath

  • 元素和属性

    //*[local-name()='encoded']|//description|//title

  • 元素(处理为 HTML)

    //*[local-name()='encoded']|//description|//title

  • 转换为Phrase 标记

    (\[[^\]]++\])++

选择 在 HTML 设置下 保留空格

多语言 XML

多语言文件作为多个双语作业导入,并在导入之前映射语言。它们在作业表中用multilingual_xml.png alt表示alt 。如果导入到多种目标语言, 则“已完成” 文件由所有目标语言组成。

Phrase 支持在所有段落中同时存在原文和译文元素的 XML 文件,即使译文为空也是如此。当原文和目标分割不同时,源分割是确定的。

单个语言元素必须都是同一跨单元元素的后代,并且一个语言不能包含在另一个元素中。源和译文 内容不能存储在属性值中。如果多个元素匹配 XPath for 原文或 trans-unit 元素内的译文,则仅导入第一个元素进行翻译。

例:

从英语到德语和法语的部分翻译文本样本。所有 <tuv lang=“en”>、<tuv lang=“de”>和<tuv lang=“fr”>都是同一<tu>, 元素的子 元素。

<?xml version="1.0" encoding="utf-8"?>
<root>
不可翻译的文本。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>First segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste 句段</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note=“other 上下文注释” key=“ID 255” maxlen=“18”> 
  <tuv lang="en">
    <赛格>第二段.</赛格>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

导入选项

对于多语言.XML文件的导入, 必须使用 XPath 查询语言。有关参考,请参阅上面的示例。XPath 表达式定义应在其中翻译文本/值的元素,而不是实际的文本节点。

  • 包含原文和译文子元素的元素

    //tu

  • 包含源语文本的元素

    tuv[@lang='en']/seg (相对于父元素 //tu

  • 包含目标文本的元素

    tuv[@lang='de']/seg (与 pa上下文注释 租金元素 //tu有关)

  • 包含目标文本的元素

    tuv[@lang='fr']/seg (相对于父元素 //tu

  • 非译元素内联元素

    原文或译文中的所有元素都被视为可译的内联元素,除非此处指定为非译元素内联元素。

  • 转换为Phrase TMS 标记

    应用正则表达式 将 指定的文本转换为标记。

  • 上下文键

    指定与句段 一起已保存翻译记忆库 并用于匹配 上下文的上下文键。

  • 上下文说明

    导入元素或为每个元素上下文属性。

  • 最大译文长度

    导入元素或每个元素的最大译文长度

  • 转换为字符实体

    在输出文件中输入字符引用列表(以逗号分隔)。

    例:

    如果需要引号 (),它们将表示为 ”quot;“, ,字符 Σ 将表示 &#x3A3; 使用 ”,&#x3A3; < 始终分别导出为 & 和<。

  • 解析 ICU 消息

    ICU 消息会自动转换为 标记。包含 ICU 消息的文件不能包含任何内联元素。

  • 使用 HTML 子筛选器

    导入文件中包含的 HTML 标记。然后,可以将标记与 HTML 文件导入设置一起使用。即使未选择分段多语言 XML ,第 标记 段 <p> 也会 创建 新建 句段。

  • 段多语言 XML

    文本按常规 分割规则 进行分段,而不是每个单元格一个句段。

    谨慎

    将段多语言 XML 应用于 包含目标文本的文件可能会导致原文中的句段数与译文中的数不同。

  • 设置非空译文的句段 状态

    选择 默认确认状态以及是否自动已添加已确认 句段翻译记忆库。

示例

如果多语言 .XML包含命名空间,则 XPath 可能如下所示:

  • 包含原文和译文子元素的元素

    //*[local-name()='trans-unit']

  • 包含源语文本的元素

    *[local-name()='source']

  • 包含目标文本的元素

    *[local-name()='target']

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.