批量导入和修改术语库内容有助于通过减少手动工作来管理和维护大规模术语。这些功能支持:
-
涉及多个术语或属性的大规模术语更新
-
跨工具和团队的协作
-
从其他系统迁移术语
-
在项目和工作流程中一致使用术语
可以以Excel(.XLSX)或.TBX文件格式导入外部术语(或术语表)文件。可以上传的文件大小限制为1 GB。导出的术语库包含给定术语库的所有语言。
如果术语库需要批量更改,例如大规模删除或更新多个术语,可以在外部电子表格应用程序中导出并批量更改。
要导入内容,请按照以下步骤操作:
-
在术语库页面,点击页面顶部的导入,在
菜单中。
将打开窗口。
-
选择要导入的文件:
-
用于电子表格应用程序(Excel)的基于XML的文件格式。
文件必须以特定方式准备以进行导入。
.XLSX是将术语导入术语库的最简单方法。可以导入术语的简单列表,但也支持更复杂的术语导入(导入同义词、形态、具有各种属性的术语等)。
-
TBX
用于其他CAT工具的交换格式。它也可以用于在外部工具中编辑内容,例如Okapi Olifant。
-
-
选择选项:
-
-
-
如果语言的区域设置与项目不同,则阻止导入该语言。
示例:
带有EN_US标识的文件将不会导入到仅标识为EN而不是EN_US的TM中。
-
术语库中的每个术语都有一组属性,可以导出到或从.TBX或.XLSX文件中导入。这些属性中的一些可以直接在术语设置中编辑,或在.XLSX或.TBX文件中外部编辑。
术语库的属性(客户、领域等)对单个术语属性没有影响。
.XLSX files
术语元数据,如禁止、首选、大小写或精确,以布尔值(TRUE/FALSE)存储在Excel中。根据您的Windows区域设置,您可能会在.XLSX导出中找到这些值的语言(例如,德语的WAHR/FALSCH)。在Excel中编辑术语库时,请遵循模式并以所需语言输入这些值,以便Excel能够识别它们并保持文件完整性。对于其他列,请使用以下所述的英文值。
-
CID
短语概念ID。术语概念包括源及其所有目标和同义词。
-
concept_domain
-
concept_subdomain
-
concept_url
-
concept_definition
-
concept_note
-
TID
短语术语ID。特定语言中特定术语的ID。
-
{语言代码}
术语的语言代码基于支持的语言。
-
status
可以是新或已核准。
-
forbidden
真或假。
-
首选
真或假。
-
案例
意味着区分大小写。该案例可以是真或假。
-
精确
意味着精确匹配。这可以是真或假(用于模糊匹配)。
-
注释
仅目标注释将在编辑器中显示。
-
用法
仅目标用法将在编辑器中显示。
-
POS
词性;值可以是形容词、名词、动词或副词。
-
gender
值可以是阳性、阴性或中性。
-
number
值可以是单数、复数或不可数。
-
short_translation
-
term_type
值可以是完整形式、简写形式、首字母缩略词、缩写、短语或变体。
-
created_by
仅支持短语用户名
-
created_at
术语创建的日期和时间
-
modified_by
仅支持短语用户名
-
modified_at
术语最后修改的日期和时间
.TBX 文件
-
<descrip type="conceptId">
短语概念 ID(需要重新导入更新的术语)。术语概念包括源及其所有目标和同义词。
-
<descrip type="conceptDefinition">
-
<descrip type="conceptDomain">
-
<descrip type="conceptNote">
-
<descrip type="conceptSubdomain">
-
<descrip type="conceptUrl">
-
<langSet xml:lang="cs">
术语的语言代码,基于支持的语言。
-
<termNote type="termId">
短语术语 ID(需要重新导入更新的术语)。这是特定语言中特定术语的 ID。
-
<note>
术语的注释
-
<termNote type="partOfSpeech">
-
<termNote type="grammaticalGender">
-
<termNote type="grammaticalNumber">
-
<termNote type="usageNote">
-
<termNote type="forbidden">
真或假
-
<termNote type="preferred">
真或假
-
<termNote type="exactMatch">
真或假
-
<termNote type="status">
新或已核准
-
<termNote type="caseSensitive">
真或假
-
<termNote type="createdBy">
短语用户名
-
<termNote type="createdAt">
Unix时间
-
<termNote type="lastModifiedBy">
短语用户名
-
<termNote type="lastModifiedAt">
Unix时间
-
<termNote type="shortTranslation">
-
<termNote type="termType">
.XLSX文件必须以特定方式格式化才能导入。
在导入包含日期或时间值的文件时,请确保单元格格式为有效的Excel日期/时间值,而不是纯文本。
要准备文件,请按照以下步骤操作:
-
在.XLSX文件中,将所有术语组织成列,每列代表一种语言。
-
在第一行中,为每种语言应用语言代码。
示例:
-
保存文件。
同义词
可以通过添加第二列相同语言代码来容纳同义词。
示例:
带属性的术语
可以导入带有指定属性的术语。有些术语是由Phrase生成的,仅在从Phrase术语库导出的文件中可用。
要将属性应用于术语,请按照以下步骤操作:
具有复杂形态的术语
正在导入的术语遵循与直接在术语库中创建的术语相同的形态规则。
除了处理同义词和模糊/精确匹配外,可以在词干(不变部分)和后缀(变化部分)之间添加管道字符作为边界。
示例:
.TBX格式支持术语导入(和导出)。.TBX标准被认为是一个宽松的标准。如果从另一个CAT工具导入.TBX文件,某些元数据可能不会被导入。
如果在两个术语库之间导入术语,请使用.TBX格式。在Phrase环境中,数据将被正确导入。
SDL Trados使用特殊的TBX.XML格式,并且它有不同的规格用于导入。
Multiterm .TBX
从Multiterm .TBX文件的导入过程已被优化,以下元数据将被导入:
-
时间戳(创建于,最后修改于)
-
元素
<descrip type="usageNote">中的值将被添加到所有概念术语的属性usage中 -
元素
<descrip type="note">中的值将被添加到所有概念术语的属性note中
SDL Trados不支持术语库的.TBX格式,而是使用带有TBX架构的.XML格式。支持导入此.XML格式,但并非所有属性。
为整个术语概念指定的属性将被添加到每个单独术语的注释中(每种语言,每个同义词等)。
导入的属性:
-
原文
-
译文
-
同义词
-
创建日期
-
修改日期
-
作者和审校者的姓名
这些仅在名称与现有Phrase用户的用户名相同时才会被导入。要么在TBX.xml中编辑名称,要么将用户添加到Phrase中。
-
自定义属性
这些将被导入到术语的注释中。每个属性将有一行,开头是属性的名称。例如:
-
来源:维基百科
-
主题:法律
-
状态:新
-
在导入之前编辑TBX.xml
为了更好地利用您的数据,在导入之前编辑TBX.xml文件。要编辑文件,请在支持多行正则表达式的文本编辑器中打开它(例如Notepad++),并且可以在搜索和替换功能中使用正则表达式。
编辑注释、使用和状态
TBX.xml文件中的自定义属性具有以下格式。属性的实际名称将不同,因为它们没有标准化:
<descripGrp> <descrip type="Comment">术语 =API= 不应被翻译</descrip> </descripGrp> <descripGrp> <descrip type="Definition">API = 应用程序编程接口</descrip> </descripGrp> <descripGrp> <descrip type="Example">短语提供了一组API调用。</descrip> </descripGrp> <descripGrp> <descrip type="Status">已确认</descrip> </descripGrp>
这些属性将自动导入到注释中:
-
备注:术语 =API= 不应被翻译
-
定义:API = 应用程序编程接口
-
示例:短语提供了一组API调用
-
状态:已确认
要更改此行为并导入,例如:
-
仅将备注作为注释
-
示例作为用法
-
状态为已核准或新建
-
不需要导入定义
编辑TBX.xml文件以符合.TBX文件的短语格式标准:
<note>术语=API=不应翻译</note> <termNote type="usageNote">短语提供了一组API调用。</termNote> <termNote type="status">已核准</termNote>
将备注更改为注释
搜索:
<descripGrp>.[^\<]+<descrip type="Comment">([^\<]+)</descrip>.[^\<]+</descripGrp>
替换:
<note>\1</note>
将示例更改为用法
搜索:
<descripGrp>.[^\<]+<descrip type="Example">([^\<]+)</descrip>.[^\<]+</descripGrp>
替换:
<termNote type="usageNote">\1</termNote>
将状态设置为已核准
搜索:
<descripGrp>.[^\<]+<descrip type="Status">[^\<]+</descrip>.[^\<]+</descripGrp>
替换:
<termNote type="status">已核准</termNote>
删除定义
<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>
替换为空字段。
向注释添加作者
从<transacGrp / origination>元素中移除作者,并将其添加到<descript>元素中。
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> <transacNote type="responsibility">MikeS</transacNote> </transacGrp>
应被替换为:
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="author">MikeS</descrip> </descripGrp>
正则表达式将是:
搜索:
(origination</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
替换:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>
将编辑者添加到注释中
要将编辑者添加到注释中,请从<transacGrp / modification>元素中移除编辑器,并将其添加到<descript>元素中。
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> <transacNote type="responsibility">lauraB</transacNote> </transacGrp>
应被替换为:
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="Edited by">lauraB</descrip> </descripGrp>
正则表达式将是:
搜索:
(modification</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
替换:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="edited by">\2</descrip>\r\n</descripGrp>
具有相关用户权限的管理员或项目经理可以将术语导出到.XLSX文件以进行修改,然后再将文件导入回来。这可以用于批量更改或删除。术语库只能逐个导出。
以下程序要求将.XLSX文件导入到其导出的同一术语库中。如果导入到不同的术语库中,术语将被重复,而不是更新,并且标记为删除的术语将不会被移除。
建议在.TBX格式中进行二次导出,以备份以防修改后的导入不正确。
要在外部修改术语,请按照以下步骤操作:
-
从术语库页面,在页面顶部的
菜单中点击导出。
窗口打开。
-
选择以导出为 。
-
选择概念和术语属性以在 和 下拉菜单中导出。
系统定义的属性以锁定图标
显示。
注释
导出术语库时,仅包含系统属性。不支持导出 自定义字段。
-
点击 导出。
.XLSX 文件已创建并下载到系统中。
-
在不删除 CID 或 TID 信息的情况下修改 .XLSX 文件以进行所需更改。
元数据(创建日期、修改日期等)可用于在电子表格应用程序中过滤术语,以仅显示特定组。
-
正在更新……
要更新术语,请在给定语言的列中重写现有术语。
与 翻译记忆 不同,
|更新后缀不是必需的,但如果添加到 CID 或 TID 中也会正常工作。可以将新术语作为额外行添加到给定语言的列中,并将其作为新术语导入到现有术语库中。
-
删除中
可以通过以下方式删除术语:
-
将 |删除 作为后缀添加到术语的 CID,以从所有语言中移除该术语。
-
将 |删除 作为后缀添加到术语的 TID,以从特定语言中删除该术语。
在所有语言(CID 列)和特定语言(TID 列)中设置删除的术语示例:
-
-
-
保存 .XLSX 文件并使用 更新现有术语 选项将其导入。