批量导入和修改术语库内容有助于管理和维护大规模术语,减少人工工作量。这些功能支持:
-
涉及多个术语或属性的大规模术语更新
-
跨工具和团队的协作
-
从其他系统迁移术语
-
在项目和工作流程中一致的术语使用
可以以Excel(.XLSX)或.TBX文件格式导入外部术语(或术语表)文件。可以上传的文件大小限制为1 GB。导出的术语库包含给定术语库的所有语言。
如果术语库需要批量更改,例如大规模删除或更新多个术语,可以在外部电子表格应用程序中导出并批量更改。
要导入内容,请按照以下步骤操作:
-
在术语库页面,点击页面顶部的导入,在
菜单中。
窗口打开。
-
选择要导入的文件:
-
用于电子表格应用程序(Excel)的基于XML的文件格式。
文件必须以特定方式准备以进行导入。
.XLSX是将术语导入术语库的最简单方法。可以导入术语的简单列表,但也支持更复杂的术语导入(导入同义词、形态、具有各种属性的术语等)。
-
TBX
用于其他CAT工具的交换格式。它也可以用于在外部工具中编辑内容,例如Okapi Olifant。
-
-
选择选项:
-
-
-
如果语言的区域与项目不同,则阻止导入该语言。
示例:
带有EN_US标识的文件将不会导入到仅标记为EN而不是EN_US的TM中。
-
术语库中的每个术语都有一组属性,可以从.TBX或.XLSX文件导出或导入。这些属性中的一些可以直接在术语设置中编辑,或在.XLSX或.TBX文件中外部编辑。
术语库的属性(客户、领域等)对单个术语属性没有影响。
.XLSX files
术语元数据如禁止、首选、大小写或精确以布尔值(TRUE/FALSE)存储在Excel中。根据您的Windows区域设置,您可能会在.XLSX导出中找到这些值的语言(例如,德语的WAHR/FALSCH)。在Excel中编辑术语库时,请遵循模式并以所需语言输入这些值,以便Excel能够识别它们并保持文件完整性。对于其他列,请使用下面所述的英语值。
-
CID
短语概念ID。术语概念包括源及其所有目标和同义词。
-
concept_domain
-
concept_subdomain
-
concept_url
-
concept_definition
-
concept_note
-
TID
短语术语ID。特定语言中特定术语的ID。
-
{语言代码}
术语的语言代码基于支持的语言。
-
status
无论是新还是已核准。
-
forbidden
真或假。
-
preferred
真或假。
-
case
意思是 区分大小写。该案例可以是真或假。
-
exact
意思是 精确匹配。这可以是真或假(对于模糊匹配)。
-
note
只有目标注释会在编辑器中显示。
-
usage
只有目标用法会在编辑器中显示。
-
POS
词性;值可以是形容词、名词、动词或副词。
-
gender
值可以是阳性、阴性或中性。
-
number
值可以是单数、复数或不可数的。
-
short_translation
-
term_type
值可以是完整形式、简写、首字母缩略词、缩写、短语或变体。
-
created_by
仅支持短语用户名
-
created_at
术语创建的日期和时间
-
modified_by
仅支持短语用户名
-
modified_at
术语最后修改的日期和时间
.TBX Files
-
<descrip type="conceptId">
短语概念 ID(需要重新导入更新的术语)。术语概念包括源及其所有目标和同义词。
-
<descrip type="conceptDefinition">
-
<descrip type="conceptDomain">
-
<descrip type="conceptNote">
-
<descrip type="conceptSubdomain">
-
<descrip type="conceptUrl">
-
<langSet xml:lang="cs">
术语的语言代码基于支持的语言。
-
<termNote type="termId">
短语术语 ID(需要重新导入更新的术语)。这是特定语言中特定术语的 ID。
-
<note>
术语的注释
-
<termNote type="partOfSpeech">
-
<termNote type="grammaticalGender">
-
<termNote type="grammaticalNumber">
-
<termNote type="usageNote">
-
<termNote type="forbidden">
真或假
-
<termNote type="preferred">
真或假
-
<termNote type="exactMatch">
真或假
-
<termNote type="status">
新或已核准
-
<termNote type="caseSensitive">
真或假
-
<termNote type="createdBy">
短语用户名
-
<termNote type="createdAt">
Unix 时间
-
<termNote type="lastModifiedBy">
短语用户名
-
<termNote type="lastModifiedAt">
Unix 时间
-
<termNote type="shortTranslation">
-
<termNote type="termType">
.XLSX 文件在导入之前必须以特定方式格式化。
在导入包含日期或时间值的文件时,请确保单元格格式为有效的Excel日期/时间值,而不是纯文本。
要准备文件,请按照以下步骤操作:
-
在.XLSX文件中,将所有术语组织成列,每列代表一种语言。
-
在第一行中,为每种语言应用语言代码。
示例:
-
保存文件。
同义词
可以通过添加第二列并使用相同的语言代码来容纳同义词。
示例:
具有属性的术语
可以导入具有指定属性的术语。一些是由Phrase生成的,仅在从Phrase术语库导出的文件中可用。
要将属性应用于术语,请按照以下步骤操作:
具有复杂形态的术语
正在导入的术语遵循与直接在术语库中创建的术语相同的形态规则。
除了处理同义词和模糊/精确匹配外,可以添加管道字符作为词干(不变部分)和后缀(变化部分)之间的边界。
示例:
.TBX格式支持术语导入(和导出)。.TBX标准被认为是一个宽松的标准。如果从另一个CAT工具导入.TBX文件,某些元数据可能不会被导入。
如果在两个术语库之间导入术语,请使用.TBX格式。在Phrase环境中,数据将被正确导入。
SDL Trados使用特殊的TBX.XML格式,并且它具有不同的规格用于导入。
Multiterm .TBX
从Multiterm .TBX文件的导入过程已优化,以下元数据将被导入:
-
时间戳(创建于,最后修改于)
-
元素
<descrip type="usageNote">中的值到概念的所有术语的属性usage。 -
元素
<descrip type="note">中的值到所有术语概念的属性 注释
SDL Trados 不支持术语库的 .TBX 格式,而是使用带有 TBX 架构的 .XML 格式。支持导入此 .XML 格式,但并非所有属性。
为整个术语概念指定的属性将添加到每个单独术语的 注释(每种语言、每个同义词等)。
导入的属性:
-
原文/源语
-
译文
-
同义词
-
创建日期
-
修改日期
-
作者和审校的姓名
只有当名称与现有 Phrase 用户的用户名相同时,这些才会被导入。要么编辑 TBX.xml 中的名称,要么将用户添加到 Phrase。
-
自定义属性
这些将被导入到术语的注释中。每个属性将有一行,开头是属性的名称。例如:
-
起源:维基百科
-
主题:法律
-
状态:新建
-
在导入之前编辑TBX.xml
为了更好地利用您的数据,请在导入之前编辑TBX.xml文件。要编辑文件,请在支持多行正则表达式的文本编辑器中打开它(例如Notepad++),并可以在搜索和替换功能中使用正则表达式。
编辑注释、用法和状态
TBX.xml文件中的自定义属性具有以下格式。属性的实际名称将不同,因为它们没有标准化:
<descripGrp> <descrip type="备注">术语 =API= 不应翻译</descrip> </descripGrp> <descripGrp> <descrip type="定义">API = 应用程序编程接口</descrip> </descripGrp> <descripGrp> <descrip type="示例">短语提供了一组API调用。</descrip> </descripGrp> <descripGrp> <descrip type="状态">已确认</descrip> </descripGrp>
这些属性将自动导入到注释中:
-
备注:术语 =API= 不应翻译
-
定义:API = 应用程序编程接口
-
例如:短语提供了一组API调用
-
状态:已确认
要更改此行为并导入,例如:
-
仅将备注作为注释
-
示例作为用法
-
状态作为 已核准 或 新
-
不需要导入 定义
编辑 TBX.xml 文件以符合 .TBX 文件的短语格式标准:
<注释>术语 =API= 不应被翻译</注释> <术语注释 type="使用注释">短语提供一组 API 调用。</术语注释> <术语注释 type="状态">已核准</术语注释>
将 备注 更改为 注释
搜索:
<descripGrp>.[^\<]+<descrip type="Comment">([^\<]+)</descrip>.[^\<]+</descripGrp>
替换:
<note>\1</note>
将 示例 更改为 用法
搜索:
<descripGrp>.[^\<]+<descrip type="Example">([^\<]+)</descrip>.[^\<]+</descripGrp>
替换:
<termNote type="usageNote">\1</termNote>
将 状态 设置为 已核准
搜索:
<描述组>.[^\<]+<描述 type="状态">[^\<]+</描述>.[^\<]+</描述组>
替换:
<术语注释 type="状态">已核准</术语注释>
删除 定义
<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>
用空字段替换。
向注释添加作者
从 <transacGrp / origination> 元素中移除作者,并将其添加到 <描述> 元素中。
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> <transacNote type="责任">MikeS</transacNote> </transacGrp>
应替换为:
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="author">MikeS</descrip> </descripGrp>
正则表达式将是:
搜索:
(origination</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
替换:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>
将编辑者添加到注释中
要将 编辑者 添加到 注释 中,请从 <transacGrp / modification> 元素中移除编辑器,并将其添加到 <descript> 元素中。
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> <transacNote type="responsibility">lauraB</transacNote> </transacGrp>
应替换为:
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="Edited by">lauraB</descrip> </descripGrp>
正则表达式将是:
搜索:
(modification</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
替换:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="edited by">\2</descrip>\r\n</descripGrp>
如果管理员已提供权限,术语可以导出为 .XLSX 文件以进行修改,然后再导入回来。这可以用于批量更改或删除。术语库只能逐个导出。
以下程序要求将 .XLSX 文件导入到其导出的同一术语库中。如果导入到不同的术语库中,术语将被重复,而不是更新,标记为删除的术语将不会被移除。
建议在 .TBX 格式中进行二次导出,以备份以防修改后的导入不正确。
要在外部修改术语,请按照以下步骤操作:
-
从 术语库页面 中,点击页面顶部
菜单中的 导出。
窗口打开。
-
选择导出为 。
-
选择概念和术语属性以在和下拉菜单中导出。
系统定义的属性以锁定图标
显示。
注释
导出术语库时,仅包含系统属性。不支持导出自定义字段。
-
点击导出。
.XLSX文件被创建并下载到系统中。
-
在不删除CID或TID信息的情况下修改.XLSX文件以进行所需更改。
元数据(创建日期、修改日期等)可用于在电子表格应用程序中筛选术语,以仅显示特定组。
-
正在更新……
要更新术语,请在给定语言的列中重写现有术语。
与翻译记忆不同,
|更新后缀不是必需的,但如果添加到CID或TID中也会正常工作。可以将新术语作为额外行添加到给定语言的列中,并将作为新术语导入到现有术语库中。
-
删除中
可以通过以下方式删除术语:
-
将|删除作为后缀添加到术语的CID,以从所有语言中移除该术语。
-
将|删除作为后缀添加到术语的TID,以从特定语言中删除该术语。
在所有语言(CID列)和特定语言(TID列)中设置删除的术语示例:
-
-
-
保存.XLSX文件并使用更新现有术语选项将其导入。