术语库 (TMS)

Modify or Import to Term Bases (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

批量导入和修改术语库内容有助于管理和维护大规模术语,减少人工工作量。这些功能支持:

  • 涉及多个术语或属性的大规模术语更新

  • 跨工具和团队的协作

  • 从其他系统迁移术语

  • 在项目和工作流程中一致的术语使用

可以以Excel(.XLSX)或.TBX文件格式导入外部术语(或术语表)文件。可以上传的文件大小限制为1 GB。导出的术语库包含给定术语库的所有语言。

如果术语库需要批量更改,例如大规模删除或更新多个术语,可以在外部电子表格应用程序中导出并批量更改

要导入内容,请按照以下步骤操作:

  1. 在术语库页面,点击页面顶部的导入,在操作 More Menu菜单中。

    导入术语库窗口打开。

  2. 选择要导入的文件:

    • XLSX

      用于电子表格应用程序(Excel)的基于XML的文件格式。

      文件必须以特定方式准备以进行导入。

      .XLSX是将术语导入术语库的最简单方法。可以导入术语的简单列表,但也支持更复杂的术语导入(导入同义词、形态、具有各种属性的术语等)。

    • TBX

      用于其他CAT工具的交换格式。它也可以用于在外部工具中编辑内容,例如Okapi Olifant

  3. 选择选项:

    • 创建新术语

    • 更新现有术语

    • 严格的区域设置匹配

      如果语言的区域与项目不同,则阻止导入该语言。

      示例

      带有EN_US标识的文件将不会导入到仅标记为EN而不是EN_US的TM中。

术语元数据在术语库中

术语库中的每个术语都有一组属性,可以从.TBX或.XLSX文件导出或导入。这些属性中的一些可以直接在术语设置中编辑,或在.XLSX或.TBX文件中外部编辑。

术语库的属性(客户、领域等)对单个术语属性没有影响。

.XLSX files

术语元数据如禁止首选大小写精确以布尔值(TRUE/FALSE)存储在Excel中。根据您的Windows区域设置,您可能会在.XLSX导出中找到这些值的语言(例如,德语的WAHR/FALSCH)。在Excel中编辑术语库时,请遵循模式并以所需语言输入这些值,以便Excel能够识别它们并保持文件完整性。对于其他列,请使用下面所述的英语值。

  • CID

    短语概念ID。术语概念包括源及其所有目标和同义词。

  • concept_domain

  • concept_subdomain

  • concept_url

  • concept_definition

  • concept_note

  • TID

    短语术语ID。特定语言中特定术语的ID。

  • {语言代码}

    术语的语言代码基于支持的语言

  • status

    无论是新还是已核准。

  • forbidden

    真或假。

  • preferred

    真或假。

  • case

    意思是 区分大小写。该案例可以是真或假。

  • exact

    意思是 精确匹配。这可以是真或假(对于模糊匹配)。

  • note

    只有目标注释会在编辑器中显示。

  • usage

    只有目标用法会在编辑器中显示。

  • POS

    词性;值可以是形容词、名词、动词或副词。

  • gender

    值可以是阳性、阴性或中性。

  • number

    值可以是单数、复数或不可数的。

  • short_translation

  • term_type

    值可以是完整形式、简写、首字母缩略词、缩写、短语或变体。

  • created_by

    仅支持短语用户名

  • created_at

    术语创建的日期和时间

  • modified_by

    仅支持短语用户名

  • modified_at

    术语最后修改的日期和时间

.TBX Files

  • <descrip type="conceptId">

    短语概念 ID(需要重新导入更新的术语)。术语概念包括源及其所有目标和同义词。

  • <descrip type="conceptDefinition">

  • <descrip type="conceptDomain">

  • <descrip type="conceptNote">

  • <descrip type="conceptSubdomain">

  • <descrip type="conceptUrl">

  • <langSet xml:lang="cs">

    术语的语言代码基于支持的语言。

  • <termNote type="termId">

    短语术语 ID(需要重新导入更新的术语)。这是特定语言中特定术语的 ID。

  • <note>

    术语的注释

  • <termNote type="partOfSpeech">

  • <termNote type="grammaticalGender">

  • <termNote type="grammaticalNumber">

  • <termNote type="usageNote">

  • <termNote type="forbidden">

    真或假

  • <termNote type="preferred">

    真或假

  • <termNote type="exactMatch">

    真或假

  • <termNote type="status">

    新或已核准

  • <termNote type="caseSensitive">

    真或假

  • <termNote type="createdBy">

    短语用户名

  • <termNote type="createdAt">

    Unix 时间

  • <termNote type="lastModifiedBy">

    短语用户名

  • <termNote type="lastModifiedAt">

    Unix 时间

  • <termNote type="shortTranslation">

  • <termNote type="termType">

准备 .XLSX(Excel)以导入到术语库

.XLSX 文件在导入之前必须以特定方式格式化。

在导入包含日期或时间值的文件时,请确保单元格格式为有效的Excel日期/时间值,而不是纯文本。

要准备文件,请按照以下步骤操作:

  1. 在.XLSX文件中,将所有术语组织成列,每列代表一种语言。

  2. 在第一行中,为每种语言应用语言代码

    示例

    A

    B

    C

    1

    en

    de_de

    it

    2

    协议

    协议

    accordo

    3

    联合委员会

    混合委员会

    混合委员会

    4

    联邦委员会

    联邦委员会

    联邦委员会

  3. 保存文件。

同义词

可以通过添加第二列并使用相同的语言代码来容纳同义词。

示例

en

en

de _de

协议

合同

协议

联合委员会

混合委员会

具有属性的术语

可以导入具有指定属性的术语。一些是由Phrase生成的,仅在从Phrase术语库导出的文件中可用。

要将属性应用于术语,请按照以下步骤操作:

  1. 在每个术语或同义词列后放置一个包含属性名称的列。

  2. 在与相关术语的行中放置属性的值。

具有复杂形态的术语

正在导入的术语遵循与直接在术语库中创建的术语相同的形态规则

除了处理同义词和模糊/精确匹配外,可以添加管道字符作为词干(不变部分)和后缀(变化部分)之间的边界。

示例

捷克语中的术语smíšen|ý也可以出现为smíšeného、smíšenou等。在ý之前放置|字符可确保所有三个结尾都被视为匹配。

.TBX导入格式

.TBX格式支持术语导入(和导出)。.TBX标准被认为是一个宽松的标准。如果从另一个CAT工具导入.TBX文件,某些元数据可能不会被导入。

如果在两个术语库之间导入术语,请使用.TBX格式。在Phrase环境中,数据将被正确导入。

SDL Trados使用特殊的TBX.XML格式,并且它具有不同的规格用于导入。

Multiterm .TBX

从Multiterm .TBX文件的导入过程已优化,以下元数据将被导入:

  • 时间戳(创建于,最后修改于)

  • 元素<descrip type="usageNote">中的值到概念的所有术语的属性usage

  • 元素 <descrip type="note"> 中的值到所有术语概念的属性 注释

从 SDL Trados 导入 TBX.xml

SDL Trados 不支持术语库的 .TBX 格式,而是使用带有 TBX 架构的 .XML 格式。支持导入此 .XML 格式,但并非所有属性。

为整个术语概念指定的属性将添加到每个单独术语的 注释(每种语言、每个同义词等)。

导入的属性:

  • 原文/源语

  • 译文

  • 同义词

  • 创建日期

  • 修改日期

  • 作者和审校的姓名

    只有当名称与现有 Phrase 用户的用户名相同时,这些才会被导入。要么编辑 TBX.xml 中的名称,要么将用户添加到 Phrase。

  • 自定义属性

    这些将被导入到术语的注释中。每个属性将有一行,开头是属性的名称。例如:

    • 起源:维基百科

    • 主题:法律

    • 状态:新建

在导入之前编辑TBX.xml

为了更好地利用您的数据,请在导入之前编辑TBX.xml文件。要编辑文件,请在支持多行正则表达式的文本编辑器中打开它(例如Notepad++),并可以在搜索和替换功能中使用正则表达式。

编辑注释、用法和状态

TBX.xml文件中的自定义属性具有以下格式。属性的实际名称将不同,因为它们没有标准化:

<descripGrp>
<descrip type="备注">术语 =API= 不应翻译</descrip>
</descripGrp>
<descripGrp>
<descrip type="定义">API = 应用程序编程接口</descrip>
</descripGrp>
<descripGrp>
<descrip type="示例">短语提供了一组API调用。</descrip>
</descripGrp>
<descripGrp>
<descrip type="状态">已确认</descrip>
</descripGrp>

这些属性将自动导入到注释中:

  • 备注:术语 =API= 不应翻译

  • 定义:API = 应用程序编程接口

  • 例如:短语提供了一组API调用

  • 状态:已确认

要更改此行为并导入,例如:

  • 仅将备注作为注释

  • 示例作为用法

  • 状态作为 已核准

  • 不需要导入 定义

编辑 TBX.xml 文件以符合 .TBX 文件的短语格式标准:

<注释>术语 =API= 不应被翻译</注释>
<术语注释 type="使用注释">短语提供一组 API 调用。</术语注释>
<术语注释 type="状态">已核准</术语注释>

备注 更改为 注释

搜索:

<descripGrp>.[^\<]+<descrip type="Comment">([^\<]+)</descrip>.[^\<]+</descripGrp>

替换:

<note>\1</note>

示例 更改为 用法

搜索:

<descripGrp>.[^\<]+<descrip type="Example">([^\<]+)</descrip>.[^\<]+</descripGrp>

替换:

<termNote type="usageNote">\1</termNote>
状态 设置为 已核准

搜索:

<描述组>.[^\<]+<描述 type="状态">[^\<]+</描述>.[^\<]+</描述组>

替换:

<术语注释 type="状态">已核准</术语注释>

删除 定义

<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>

用空字段替换。

向注释添加作者

<transacGrp / origination> 元素中移除作者,并将其添加到 <描述> 元素中。

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type="责任">MikeS</transacNote>
</transacGrp>

应替换为:

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="author">MikeS</descrip>
</descripGrp>

正则表达式将是:

搜索:

(origination</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>

替换:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>

将编辑者添加到注释中

要将 编辑者 添加到 注释 中,请从 <transacGrp / modification> 元素中移除编辑器,并将其添加到 <descript> 元素中。

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type="responsibility">lauraB</transacNote>
</transacGrp>

应替换为:

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="Edited by">lauraB</descrip>
</descripGrp>

正则表达式将是:

搜索:

(modification</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>

替换:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="edited by">\2</descrip>\r\n</descripGrp>

批量术语库删除或更新

如果管理员已提供权限,术语可以导出为 .XLSX 文件以进行修改,然后再导入回来。这可以用于批量更改或删除。术语库只能逐个导出。

以下程序要求将 .XLSX 文件导入到其导出的同一术语库中。如果导入到不同的术语库中,术语将被重复,而不是更新,标记为删除的术语将不会被移除。

建议在 .TBX 格式中进行二次导出,以备份以防修改后的导入不正确。

要在外部修改术语,请按照以下步骤操作:

  1. 术语库页面 中,点击页面顶部 操作 More Menu 菜单中的 导出

    导出术语库 窗口打开。

  2. 选择导出为 XLSX

  3. 选择概念和术语属性以在概念字段术语字段下拉菜单中导出。

    系统定义的属性以锁定图标System-defined attribute显示。

    注释

    导出术语库时,仅包含系统属性。不支持导出自定义字段

  4. 点击导出

    .XLSX文件被创建并下载到系统中。

  5. 在不删除CID或TID信息的情况下修改.XLSX文件以进行所需更改。

    元数据(创建日期、修改日期等)可用于在电子表格应用程序中筛选术语,以仅显示特定组。

    • 正在更新……

      要更新术语,请在给定语言的列中重写现有术语。

      翻译记忆不同,|更新后缀不是必需的,但如果添加到CID或TID中也会正常工作。

      可以将新术语作为额外行添加到给定语言的列中,并将作为新术语导入到现有术语库中。

    • 删除中

      可以通过以下方式删除术语:

      • |删除作为后缀添加到术语的CID,以从所有语言中移除该术语。

      • |删除作为后缀添加到术语的TID,以从特定语言中删除该术语。

      在所有语言(CID列)和特定语言(TID列)中设置删除的术语示例:

      modify-term_excel.png
  6. 保存.XLSX文件并使用更新现有术语选项将其导入。

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.