术语库 (TMS)

Modify or Import to Term Bases (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

外部术语(或术语表)文件可以用 Excel (.XLSX) 或 .TBX 文件格式导入。可上传文件的大小限制为 1GB。导出的术语库包含给定术术语库的所有语言。

如果术语库需要批量更改,例如批量删除或更新许多术语,可以在外部电子表格应用程序中导出和批量更改

要导入内容,请遵循以下步骤:

  1. 从术语库页面,单击导入

    导入 TBX/XLSX 窗口打开。

  2. 选择要导入的文件:

    • XLSX

      电子表格应用程序基于 XML 的文件格式 (Excel)。

      文件必须以特定方式准备导入。

      .XLSX 是将术语导入术语库的最便捷方法。可以导入术语的普通列表,但也支持更复杂的术语导入(导入同义词、形态、具有各种属性的术语等)。

    • TBX

      供其他 CAT 工具使用的交换格式。也可用于编辑Okapi Olifant等外部工具中的内容。

  3. 选择选项:

    • 创建新术语

    • 更新现有术语

    • 严格的区域设置匹配

      如果语言的区域与项目不同,则阻止导入。

      示例

      带有 EN_US 标记的文件不会导入仅带有 EN 标记而不是 EN_US 标记的翻译记忆库。

术语库中的术语元数据

术语库中的每个术语都有一个属性列表,可以导出到 .TBX 或 .XLSX 文件或从这些文件导入。其中一些属性可以直接在术语设置中编辑,也可以在外部的.XLSX或.TBX文件中编辑。

术语库(客户、领域等)的属性对单个术语属性没有影响。

.XLSX 文件

术语元数据,如禁止首选大小写精确等,在Excel中以布尔值(TRUE/FALSE)的形式存储。根据您的 Windows 区域设置,您可以在 .XLSX 导导出中找到这些语言值(例如德语的 WAHR/FALSCH)。在 Excel 中编辑术语库时,遵循模式并以所需的语言输入这些值,以便 Excel 能够识别它们并保持文件的完整性。对于其他列,使用英语值,如下所示。

  • CID

    phrase Concept ID。术语概念包括原文/源语及其所有目标和同义词。

  • concept_domain

  • concept_subdomain

  • concept_url

  • concept_definition

  • concept_note

  • TID

    phrase 术语 ID。特定语言中特定术语的 ID。

  • {语言代码

    基于支持语言的术语的语言代码。

  • status

    新建或已核准。

  • forbidden

    真假

  • preferred

    真假

  • case

    表示区分大小写。大小写可以是 True 或 False。

  • 精确

    意思是精确匹配这可以是 True 或 False(用于模糊匹配匹配)。

  • 注释

    编辑器中只显示译文注释。

  • usage

    编辑器中只显示译文的用法。

  • POS

    语音的一部分;值可以是形容词、名词、动词或副词。

  • gender

    值可以是男性、女性或建议。

  • number

    值可以是单数、复数或不可数。

  • short_translation

  • term_type

    值可以是 Full_form、Short_form、Acronym、Abreviation、 phrase 或 Variant。

  • created_by

    仅支持 phrase 用户名

  • created_at

    术语创建的日期和时间

  • modified_by

    仅支持 phrase 用户名

  • modified_at

    最后修改术语的日期和时间

.TBX 文件

  • <descrip type="conceptId">

    phrase Concept ID(重新导入更新的术语需要)。术语概念包括原文/源语及其所有目标和同义词。

  • <descrip type="conceptDefinition">

  • <descrip type="conceptDomain">

  • <descrip type="conceptNote">

  • <descrip type="conceptSubdomain">

  • <descrip type="conceptUrl">

  • <langSet xml:lang="cs">

    术语的语言代码,基于支持的语言。

  • <termNote type="termId">

    phrase 术语 ID(重新导入更新的术语需要)。这是特定语言中特定术语的 ID。

  • <note>

    术语注释

  • <termNote type="partOfSpeech">

  • <termNote type="grammaticalGender">

  • <termNote type="grammaticalNumber">

  • <termNote type="usageNote">

  • <termNote type="forbidden">

    真假

  • <termNote type="preferred">

    真假

  • <termNote type="exactMatch">

    真假

  • <termNote type="status">

    新建或已核准

  • <termNote type="caseSensitive">

    真假

  • <termNote type="createdBy">

    Phrase 用户名

  • <termNote type="createdAt">

    Unix 时间

  • <termNote type="lastModifiedBy">

    Phrase 用户名

  • <termNote type="lastModifiedAt">

    Unix 时间

  • <termNote type="shortTranslation">

  • <termNote type="termType">

准备 .XLSX (Excel) 导入术语库

.XLSX 文件在导入前必须采用特定格式。

要准备文件,请遵循以下步骤:

  1. 在 .XLSX 文件中,将所有术语组织成列,每列代表一种语言。

  2. 在第一行,应用每种语言的语言代码

    示例

    A

    B

    C

    1

    en

    de_de

    it

    2

    协议

    阿布库门语

    accordo

    3

    联合委员会

    Gemischte Kommission

    委托

    4

    联邦委员会

    联邦参议院

    Consiglio Federale

  3. 保存文件。

同义词

添加具有相同语言代码的第二列可以容纳同义词。

示例

en

en

de _de

协议

合同

阿布库门语

联合委员会

Gemischte Kommission

带属性的术语

术语可以用指定的属性导入。有些由 Phrase 生成,仅适用于从 Phrase 术语库 导出的文件。

要将属性应用于术语,请遵循以下步骤:

  1. 在每个术语或同义词列之后放置一列,属性名称为。

  2. 将属性值与相关术语放在行中。

具有复杂形态的术语

正在导入的术语遵循与直接在术语库中创建的术语相同的形态学规则

除了使用同义词和模糊匹配/精确匹配外,还可以添加管道字符为词干(更改的部分)和后缀(更改的部分)之间的边界。

示例

捷克语中的术语smíšen|ý 也可以称为smíšeného、smíšenou等。将 | 字符放在 ý 之前,确保所有三个结尾都被认为是匹配的。

.TBX导入格式

术语导入(和导出)支持 .TBX 格式式。.TBX 标准被认为是松散的标准。如果从其他 CAT 工具导入 .TBX 文件,则可能无法导入某些元数据

如果在两个术语库之间导入术语信息,使用.TBX格式。在 Phrase 环境中,数据将被正确导入。

SDL Trados 使用特殊的 TBX.XML 格式,导入时有不同的规范

多术语 .TBX

优化了从 Multiterm .TBX 文件的导入流程,将导入以下元数据:

  • 时间戳(创建于,最后修改于)

  • 元素 <decrip type="usageNote"> 中的概念所有术语属性用法的值

  • 概念所有术语属性注释元素 <decrip type="note"> 中的值

从 SDL Trados 导入 TBX.xml

SDL Trados 不术语的 .TBX 格式式,而是将 .XML 格式式与 TBX 模式一起使用。支持导入此 .XML 格式,但不支持所有属性。

为整个术语概念指定的属性将被添加到每个术语的注释中(每种语言、每个同义词等)

导入的属性:

  • 原文

  • 目标

  • 同义

  • 创建日期

  • 修改日期

  • 作者和审校名称

    仅当名称与现有 phrase 用户的用户名相同时,才会导入。在 TBX.xml 中编辑名称或将用户添加到 phrase。

  • 自定义属性

    这些将被导入术语的注释中。每个属性都将有一个单独的行,以属性的名称开头。例如:

    • 起源:维基百科

    • 主题:法律

    • 状态:新建

导入前编辑TBX.xml

为了最好地使用您的数据,在导入之前编辑TBX.xml文件。要编辑文件,请在支持多行正则表达式(如记事本++)的文本编辑器中打开,该编辑器可以在搜索和替换功能中使用正则表达式。

编辑注释、使用情况和状态

TBX.xml 文件中的自定义属性有以下格式。属性的实际名称将不同,因为它们不是标准化的:

<descripGrp>
<descrip type="备注">术语 = API= 不应翻译</descrip>
</descripGrp>
<descripGrp>
<descrip type="Definition">API = 应用程序编程接口</descrip>
</descripGrp>
<descripGrp>
<descrip type="示例"> phrase 提供了一组 API 调用。</descrip>
</descripGrp>
<descripGrp>
<descrip type="状态">已确认</descrip>
</descripGrp>

这些属性将自动导入 Note

  • 备注:术语=API=不应翻译

  • 定义:API = 应用程序编程接口

  • 例如:Phrase 提供了一组 API 调用

  • 状态:已确认

更改此行为并导入,例如:

  • 仅备注

  • 使用示例

  • 状态为已核准

  • 不需要导入定义

编辑 TBX.xml 文件以符合 .TBX 文件的 phrase 格式标准:

<note>术语 = API= 不应翻译</note>
<termNote type="usageNote"> phrase 提供了一组 API 调用。</termNote>
<termNote type="状态">已核准</termNote>

备注更改为备注

搜索:

<descripGrp>.[^\<]+<descrip type="备注">([^\<]+)</descrip>.[^\<]+</descripGrp>

替换:

<note>\1</note>

示例更改为使用

搜索:

<descripGrp>.[^\<]+<descrip type="示例">([^\<]+)</descrip>.[^\<]+</descripGrp>

替换:

<termNote type="usageNote">\1</termNote>
状态设置为已核准

搜索:

<descripGrp>.[^\<]+<descrip type="状态">[^\<]+</descrip>.[^\<]+</descripGrp>

替换:

<termNote type="状态">已核准</termNote>

删除 定义

<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>

替换为empty段。

添加作者注意

<transacGrp/origin> 元素移除作者并将其添加到 <descript> 元素。

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type=" responsibility">MikeS</transacNote>
</transacGrp>

应改为:

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="作者">MikeS</descrip>
</descripGrp>

正则表达式将是:

搜索:

(origin</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type=" responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>

替换:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>

为备注添加 编辑

要将 Edited by 添加到 Note,请从 <transacGrp/Modify> 元素移除编辑器并将其添加到 <descript> 元素。

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type="responsibility">lauraB</transacNote>
</transacGrp>

应改为:

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="Edited by">lauraB</descrip>
</descripGrp>

正则表达式将是:

搜索:

(修改</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type=" responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>

替换:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="edited by">\2</descrip>\r\n</descripGrp>

批量删除或更新术语库

如果管理员提供了权限,可以将术语导出到 .XLSX 文件中进行修改,然后再导入回来。这可用于批量更改或删除。术语库只能一个一个导出。

以下步骤要求将 .XLSX 文件导入导出的相同术语库。如果导入其他术语库,术语将被复制而不是更新,标记为删除的术语不会被删除。

建议以 .TBX 格式式进行二次导出,以备修改导入不正确时使用。

要在外部修改术语,请遵循以下步骤:

  1. 术语库页面上,单击导出

    打开“导出 TBX/XLSX”窗口。

  2. 选择 XLSX 作为格式

  3. 选择要导出的术语属性。

  4. 单击导出

    .XLSX 文件已创建并下载到系统中。

  5. 在不删除 CID 或 TID 信息的情况下,修改 .XLSX 文件,并进行所需的更改。

    元数据(创建日期、修改日期等)可用于在电子表格应用程序中筛选术语,以仅显示特定的组。

    • 正在更新……

      要更更新术语,请重写给定语言列中的现有术语。

      翻译记忆库不同,|更新后缀不是必需的,但如果添加到CID或TID中,将正常工作。

      新术语可以作为附加行添加到给定语言的列,并将作为新术语导入现有术语库。

    • 删除中

      术语可以通过以下方法删除:

      • 添加 | 删除 作为术语 CID 的后缀,从所有语言移除该术语。

      • 在术语的 TID 中添加|删除作为后缀,以从特定语言中删除该术语。

      在所有语言(CID 列)和特定语言(TID 列)中设置要删除的术语示例:

      modify-term_excel.png
  6. 保存 .XLSX 文件,然后使用更新现有术语选项导入。

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.