分析计算所选文件中的字符和字数,并识别:
分析还可以显示审校者所做的修订次数。
分析可以由项目经理或管理员创建。语言学家不能被允许运行自己的分析。供应商可以为共享的工作/项目创建分析。
一些CAT工具将分析称为统计数据。
组织分析由分析仪表盘提供。
由于不同国家使用不同的计费单位,因此提供三种计算方法:
-
字符
不包括空格。
-
字数
对于在单词之间使用空格的语言——不包括中文、日文和泰文。
-
页数
1800个字符(包括空格)——与文件中的实际页数无关。
由于不同语言之间的计数方法不同,所呈现的字数统计可能与其他应用程序生成的字数统计不相同。
用于分析的字数统计与MTU计算的字数统计不同。
-
每个合并标签都被替换为一个空格。
-
其他标签被移除。
在使用空格分隔单词的语言中(例如,英语):
-
每个包含
+-,.的数字序列被替换为一个字符(使用正则表达式表达式[+-]?[0-9]+([., -]?[0-9]++)*+)。 -
每个空格序列被替换为一个空格。
-
段落开头和结尾的空格被移除。
-
每个不同于空格的字符序列被计算为一个单词。
在不使用空格分隔单词的语言中(例如,日语):
-
一些标点符号从文本中被移除(使用正则表达式
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}])。 -
段落被拆分为属于非空格(NWS)汉字、平假名、片假名和泰文字符的字符序列,以及不属于这些字符的序列(WS)。
-
总字数 = (NWS的字数) + (WS的字数)。
-
WS的字数计算方式与英语相同。
-
NWS的字数是没有空格的字符数。
-
对于泰文,字数是没有空格的字符数除以2。
注释
来自CJK语言的字符被计算为字符和单词。
要创建分析,请按照以下步骤操作:
-
在页面,从中选择一个或多个。
-
点击分析。
窗口打开。
-
从下拉列表中选择一个。
-
如有需要,请提供名称。
-
可用于分析命名的宏:
-
{projectName} -
{sourceLang}添加源语言
-
{targetLang}添加目标语言。如果分析多个语言,则语言将为空。
-
{userName}添加分配的译员或供应商的用户名。如果分配了多个译员,则名称将为空。
-
{workflow} -
{innerId} -
{fileName}如果用于分析的文件/工作更多,则
{文件名}将为空。
-
-
-
选择分析选项。特别是:
-
应用选项将影响字数统计,因为数字将不被计算为单词。
-
选项比较分析工作中的段落与文件内的相似性,而不仅仅是与翻译记忆库进行比较。
如果勾选,内部模糊匹配将在新创建的分析中作为单独类别显示。例如:
一个包含10个源词的翻译工作包括以下段落,只有最后一个字符不同:
-
我买了一辆新车。
-
我买了一辆新车!
如果在翻译记忆库中未找到匹配项,将显示默认分析:
如果选项
翻译记忆库类别:0%-49%
翻译记忆库类别:95%-99%
如果类别:95%-99%
包含如果 禁用
10个词
包含如果 启用 + 分开如果 禁用
5个词
5个词
包含如果 + 分开如果 启用
5个词
5个词
-
-
-
点击分析。
分析或分析结果已添加到列表中。
-
点击列表中的分析以在详细页面中查看,或下载以在项目管理应用程序中渲染。
注释
创建分析时可以设置分析选项,在项目级别或在设置中全局设置。
提供三种分析类型:
译后编辑分析在目标句段上运行,并指示编辑工作量;文本需要多少来自译员或校对员的编辑。在译后编辑完成后运行。
当译员点击未翻译的句段时,当前最高的翻译记忆匹配、机器翻译建议和/或非可翻译项会被保存,并用于译后编辑分析。
可以从任何工作流步骤启动译后编辑分析,并计算从可用源(例如TM/MT)插入的文本与句段目标中的译后编辑结果之间的差异。
译后编辑分析扩展了传统的翻译记忆分析,包括机器翻译(MT)和非可翻译项(NT)。第三方MT引擎也受到支持。
重要
禁用和不会将TM/MT匹配项排除在分析之外。在这种情况下,分析考虑较高可用匹配的分数,而不是译后编辑的工作量。
在译后编辑分析中,101%的TM结果并不一定意味着该句段是从TM翻译而来的。
示例
使用MT翻译的工作仍然可以显示为101% TM,如果禁用并且在打开句段时可用101% TM匹配。
后分析选项
译后编辑选项用于计算来自翻译记忆(TM)、非可翻译项(NT)和机器翻译(MT)的匹配所需的译后编辑工作量。
启用分析TM译后编辑
-
用于包含高百分比匹配的低质量翻译记忆库,需译员编辑。
-
指示翻译记忆库的译后编辑工作量。
-
分析中仅包含100%匹配项。翻译记忆库中的上下文101%匹配对计算没有影响。
分析翻译记忆库的译后编辑已禁用
-
用于高质量翻译记忆库,其中匹配项应尽量少编辑以降低成本。
-
指示101%和100%。
-
指示当段落被打开时提供给译员的翻译记忆库匹配(而非实际译员的译后编辑工作量)。
-
指示机器翻译和非翻译元素的译后编辑工作量。
分析非翻译元素/机器翻译的译后编辑已启用
-
如果机器翻译或非翻译元素的建议被接受而没有进一步编辑,则在分析中呈现为100%匹配。
-
如果译员更改机器翻译,匹配率将降低。计分算法与计算翻译记忆库模糊匹配分数的算法相同。
-
编辑非翻译元素将导致该段呈现为0-49%非翻译元素。
分析非翻译元素/机器翻译的译后编辑已禁用
在源更新之前自动生成译后编辑分析
-
分析创建于:
-
针对每个更新的工作。
-
针对每个单独的服务商,并分配给相应的服务商。
-
-
如果未创建分析:
-
没有译员或供应商被分配。
-
-
分析计算已确认和翻译的段落。
-
分析遵循命名约定:
-
更新源 #{innerID}{工作流}
-
-
分析将创建,选择计数单位(源)、分析非译元素的译后编辑、分析翻译记忆库的译后编辑和分析机器翻译的译后编辑。
计数单位的
-
选择在分析中呈现的字数统计。目标字数统计可能高于源字数统计。
不影响匹配评分。
比较分析功能仅在具有工作流步骤的项目中可用。它在段落级别比较文件的两个版本在不同工作流步骤中的差异,并分析这两个版本的不同。如果分析没有项目特定的设置,则使用默认设置,这可能导致报告不正确。
示例
分析可以在多个工作上运行,并可以通过两种方式进行分组:
-
按服务商分析
-
对于分配给不同语言学家或供应商的多个工作的项目。用于:
-
创建包含分配给各个语言学家或供应商的文件的单独分析。
-
将分析分配给服务商,使分析对其语言学家/供应商可见。
如果对服务商应用了净计费方案,则该选项将被预先选中。
-
-
-
按语言分析
自定义分析视图
在分析表中可以显示/隐藏 、、、 和 列。 列也适用于译后编辑分析,指示编辑一个句段所花费的秒数。
下载分析
要下载分析,请按照以下步骤操作:
-
点击 下载 以显示下拉菜单并选择:
-
CSV(逗号分隔值),可以包含或不包含字符,并可与电子表格应用程序兼容。
-
LOG(类似于SDL Trados格式),可与大多数项目管理应用程序兼容。
-
JSON(JavaScript对象表示法),一种轻量级数据交换格式。
仅以JSON格式下载的分析将包括每种匹配类型的NT、MT、TM和内部模糊(IF)数据的细分。
-
-
选择文件类型会触发下载。
这些文件可以导入到大多数项目管理软件系统中。
应用 净计费方案
可以在分析中对单词/字符/页面应用折扣。折扣翻译量会立即计算并直接在行的分析中显示。
要从分析中移除净计费方案,请将按钮旁边的字段留空。
当净计费方案应用于分析时,下载的分析文件会在每个匹配类别中显示加权字数。
要将分析分配给服务商,请按照以下步骤操作:
-
从列表中选择一个分析并点击编辑。
这会打开编辑页面。
-
从下拉列表中选择一个服务商。
-
点击保存。
该分析将在译员门户上提供给分配的服务商。