分析 (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

分析计算所选文件中的字符数和字数，并识别：

重复（包括跨文件重复）

只有重复句段的第一次出现会被单独计算，归入常规匹配百分比或内部模糊匹配类别中。重复计算该相同句段的后续出现次数。示例：一个包含两个完全相同句段的工作显示为 重复：1 个句段，而不是 2。这反映了计算规则。
翻译记忆库匹配，
非译元素
内部模糊匹配
机器翻译建议

分析还可以显示审校所做的修订次数。

分析可由项目经理或管理员创建。译员不能被允许运行他们自己的分析。供应商可以为共享的工作/项目创建分析。

一些 CAT 工具将分析称为统计信息。

组织分析由分析仪表盘提供。

由于不同国家使用不同的计费单位，因此提供三种计算方法：

字符

不含空格。
字数

对于在单词之间使用空格的语言——不包括中文、日语和泰语。
页

1800 个字符（含空间）——与文件中的实际页数无关。

字数统计

由于不同语言的计数方法不同，所显示的字数统计可能与其它应用程序生成的字数统计不同。

用于分析的字数统计与 MTU 计算的字数统计不同。

每个合并标签都被替换为一个空间。
其它标签会被移除。

在使用空格<1> 分隔单词的语言中（例如：英语）：

每个包含 +-,. 的数字序列都被替换为一个字符（使用 regex 表达式 [+-]?[0-9]+([., -]?[0-9]++)*+）。
每个空格序列都被替换为一个空间。
句段开头和结尾的空间会被移除。
每个不同于空间的字符序列都被计为一个字。

对于不使用空格分隔单词的语言（例如：日语）：

一些标点符号会从文本中移除（使用 regex 表达式 [\\u2000-\\u206F\\u2E00-\\u2E7F\\u3000-\\u3004\\u3006-\\u301F\\\\p{P}]）。
句段被拆分为属于非空格 (NWS) 汉字、平假名、片假名和泰语脚本的字符序列，以及不属于这些脚本的字符序列 (WS)。
总字数 = (来自 NWS 的字数) + (来自 WS 的字数)。
来自 WS 的字数计算方式与英语相同。
来自 NWS 的字数是不含空间的字符数。
对于泰语，字数是不含空间的字符数除以 2。

注释

CJK语言的字符既被计为字符，也被计为字数。

创建分析

要创建分析，请遵循以下步骤：

在项目页面中，选择一个或多个工作。
点击分析。

分析窗口随即打开。
从下拉列表选择一个类型。
如果需要，请提供名称。
- 可用于分析命名的宏：
  - {projectName}
  - {sourceLang}
    
    添加源语言
  - {targetLang}
    
    添加译文语言。如果分析多种语言，则语言将为空。
  - {userName}
    
    添加已分配译员或供应商的用户名。如果分配了多名译员，则名称将为空。
  - {workflow}
  - {innerId}
  - {fileName}
    
    如果分析使用了多个文件/工作，则 {fileName} 将为空。

选择分析选项。具体包括：

应用排除数字选项会影响字数统计，因为数字不会被计算为字数。

包含内部模糊匹配选项会将分析工作中的片段与文件内的相似内容进行比较，而不是仅将其与翻译记忆库进行比较。

如果勾选了 Separate internal fuzzies，内部模糊匹配将在新建的分析中显示为一个单独的类别。例如：

一个包含 10 个原文/源语字数的工作包含以下片段，其中仅最后一个字符不同：

我买了一辆新车。
我买了一辆新车！

如果翻译记忆库中未找到匹配项，将显示默认分析：

IF 选项	翻译记忆库类别：0%-49%	翻译记忆库类别：95%-99%	IF 类别：95%-99%
Include IF 已禁用	10 字数
Include IF 已启用 + Separate IF 已禁用	5 字数	5 字数
Include IF + Separate IF 已启用	5 字数		5 字数

点击分析。

分析或多个分析会被添加到列表中。
点击列表中的分析，即可在分析详情页面中查看，或将其下载以便在项目管理应用程序中呈现。

注释

分析选项可在创建分析时、项目级别或在“设置” 下全局设置。

提供三种分析类型：

默认分析

默认分析是在翻译之前对原文/源语片段运行的标准分析。它提供了工作的基础分析，可与译后编辑分析结合使用，以确定在该工作中投入了多少翻译精力。此基准也用作向客户生成报价的基础。

默认使用预翻译<2>中设置的翻译记忆库阈值，但如有需要可以更改。

系统会生成句段/字数/字符数的细分，如果用于项目中，还会识别翻译记忆库匹配以及非译元素、内部模糊匹配和QPS（质量评估分数）（如果已启用）。

重要

在翻译后运行默认分析会产生不正确的分析结果。

译后编辑分析

译后编辑分析在译文句段上运行，用于指示编辑工作量；即文本需要译员或校对员进行多少编辑。它在译后编辑完成后运行。

当译员点击未翻译的句段时，当前最高的翻译记忆库匹配、机器翻译建议和/或非译元素会保存到该句段中，并用于译后编辑分析。

译后编辑分析可在任何工作流步骤中启动，其计算方式为从可用原文（例如翻译记忆库/机器翻译）插入的文本与句段译文中译后编辑结果之间的差异。

译后编辑分析扩展了传统的翻译记忆库分析，纳入了机器翻译 (MT) 和非译元素 (NT)。也支持第三方机器翻译引擎。

重要

禁用分析翻译记忆库译后编辑和分析非译元素/机器翻译译后编辑并不会将翻译记忆库/机器翻译匹配从分析中排除。在这种情况下，分析会考虑较高可用匹配的分数，而不是译后编辑工作量。

译后编辑分析中的 101% 翻译记忆库结果并不一定意味着该句段是由翻译记忆库翻译的。

示例

如果禁用了分析翻译记忆库译后编辑，且在打开句段时存在 101% 的翻译记忆库匹配，那么使用机器翻译翻译的工作仍可能显示为 101% 翻译记忆库匹配。

分析后选项

译后编辑选项用于计算翻译记忆库 (TM)、非译元素 (NT) 和机器翻译 (MT) 匹配所需的译后编辑工作量。

启用分析翻译记忆库译后编辑

旨在用于包含需要译员编辑的高百分比匹配的低质量翻译记忆库。
指示翻译记忆库的译后编辑工作量。
分析中仅包含 100% 匹配。来自翻译记忆库的上下文 101% 匹配对计算没有影响。

分析翻译记忆库译后编辑已禁用

适用于高质量翻译记忆库，其中匹配项应尽可能少地进行编辑以降低成本。
指示 101% 和 100% 匹配。
指示在打开句段时提供给译员的翻译记忆库匹配（而非译员实际的译后编辑工作量）。
指示机器翻译和非译元素的译后编辑工作量。

分析非译元素/机器翻译译后编辑已启用

如果机器翻译或非译元素建议在未经进一步编辑的情况下被接受，则在分析中将其显示为 100% 匹配。
如果译员更改了机器翻译，匹配率将会降低。分数计算算法与用于计算翻译记忆库模糊匹配分数的算法相同。
编辑非译元素将导致该句段显示为 0-49% 非译元素。

分析非译元素/机器翻译译后编辑已禁用

来自机器翻译/非译元素的条目若无任何预估分数，将被视为翻译记忆库 0%-49% 匹配。它们将被指示为由译员翻译，且不考虑机器翻译。
QPS（质量评估分数）和 Phrase Language AI 高于 75% 的匹配项将出现在各自匹配项的机器翻译列中。
指示在打开句段时提供给译员的非译元素/机器翻译匹配（而非译员实际的译后编辑工作量）。

在原文/源语更新前自动生成译后编辑分析

分析创建于：
- 针对每个更新的工作。
- 针对每个单独的服务商，并分配给相应的服务商。
在以下情况下不会创建分析：
- 未分配译员或供应商。
分析会统计已确认和已翻译的句段。
分析遵循以下命名约定：
- 更新原文 #{innerID}{工作流}
分析将通过选择统计单位（原文）、分析非译元素译后编辑、分析翻译记忆库译后编辑和分析机器翻译译后编辑来创建。

统计单位的

原文/译文

选择要在分析中呈现的字数统计。译文字数统计可能会高于原文字数统计。

不影响匹配评分。

比较分析

可用于

Team、Ultimate 和 Enterprise（原）套餐中

关于许可问题，请联系销售团队。

比较分析功能仅适用于具有工作流步骤的项目。它会在句段级别比较不同工作流步骤中的两个文件版本，并分析这两个版本有何不同。如果没有针对分析的项目特定设置，则会使用默认设置，这可能会导致报告不准确。

示例

翻译步骤和审校步骤之间的比较通过识别翻译在审校步骤中更改了多少，来表明审校人员的实际工作量。

分析可以在多个工作上运行，并可以通过两种方式进行分组：

按服务商分析
- 适用于分配给不同译员或服务商的多个工作任务的项目。用于：
  - 创建包含分配给个人译员或服务商的文件的独立分析。
  - 将分析分配给服务商，使其译员/服务商可见。
  如果已为服务商应用净计费方案，则该选项将被预选。
按语言分析
- 如果项目包含多种译文语言，则可以批量运行所有文件的分析，为每种语言分别创建分析。
  
  若要按语言分析，请按照以下步骤操作：
  1. 在项目页面中，选择所有工作文件。
  2. 点击分析。
    
    分析窗口随即打开。
  3. 保持默认设置并选择按语言分析。
  4. 点击分析。
    
    工作任务分析按语言准备。
  注释
  
  取消选择此选项可为多语言项目创建一个单一分析。

分析重新计算

当分析的原文/源语文件更新时，它会在分析表中被标记为过期。

重新计算将应用原始分析所使用的设置。

服务商不允许重新计算由买方创建的分析。

若要使用新的原文/源语文件进行重新计算，请按照以下步骤操作：

选择过期的分析
点击重新计算。

“重新计算分析”窗口会一直打开，直到重新计算完成。关闭后，重新计算即完成，过时指示器也会被清除。

自定义分析视图

句段、页数、字数、字符数和百分比列可以在分析表中显示或隐藏。编辑时间列也可用于译后编辑分析，并显示编辑一个句段所花费的秒数。

下载分析

要下载分析，请按照以下步骤操作：

点击下载以显示下拉菜单并选择：
- CSV（逗号分隔值），包含或不包含字符，可由电子表格应用程序读取。
- LOG（类似于 SDL Trados 格式），可被大多数项目管理应用程序读取。
- JSON（JavaScript 对象表示法），一种轻量级的数据交换格式。
只有以 JSON 格式下载的分析才会包含按匹配类型细分的非译元素、机器翻译、翻译记忆库和内部模糊匹配 (IF) 数据。
选择文件类型即可触发下载。

这些文件可以导入到大多数项目管理软件系统中。

应用净计费方案

可以在分析中对字数/字符数/页数应用折扣。折扣后的翻译量会立即计算出来，并直接显示在分析的净计费行中。

要从分析中移除净计费方案，请将应用净计费按钮旁边的字段留空。

当分析应用了净计费方案时，下载的分析文件会显示每个匹配类别中的加权字数。

将分析分配给服务商

若要将分析分配给服务商，请遵循以下步骤：

从列表中选择一项分析，然后点击编辑。

这会打开编辑页面。
从下拉列表中选择服务商。
点击保存。

该分析将在译员门户网站上提供给已分配的服务商。