分析仪表盘可以通过导航面板上的 短语分析 按钮访问。
根据我们的内部 数据存储 政策,任何客户输入的文本(例如项目名称、文件名称、域名)来自永久删除的内容不会出现在短语分析中。永久删除的内容将被 已删除 替换。所有来自永久删除内容的数值、日期、时间戳、布尔数据类型仍然可用。这确保了历史 KPI、趋势和预测聚合在时间上保持一致。
-
显示 按服务商 的图表包括语言学家和供应商。
-
语言对以源语言到目标语言的连接形式显示。
-
显示 按项目 的图表仅显示前 10,000 个项目,而完整的项目列表在下载时包含。
-
仪表盘以 UTC 时区显示数据。
-
仪表盘每天刷新两次:
-
欧盟实例的 UTC 时间 12:00am 和 12:00pm
-
美国实例的 UTC 时间 07:00am 和 19:00pm
每个仪表盘显示最后一次数据刷新完成的时间。重要的是要注意,显示的时间戳可能不包括在 3 小时之前生成的数据。这是因为在触发数据刷新过程时,交易可能未能及时捕获。
-
-
数据报告可用于过去 12 个月,允许用户在任何时间点查看整整一年的数据。
仪表盘的视频回顾:
项目经理角色的访问权限可以由管理员在用户设置中设置,以查看高级分析图表和仪表盘。
每个仪表盘支持不同的筛选器,以在图表中显示选定的数据。特别是,工作状态筛选器考虑以下工作状态:
-
。
-
。
当工作或项目被删除时,只要它在回收站中,就会被标记为此状态。
-
。
通过手动或自动清空回收站而移除的工作。
-
。
注释
当工作被归档时,其状态会更改为已归档。当项目被归档时,工作的状态不会改变。
建议日期筛选器的运行时间不超过一年,因为性能可能会下降,图表可能不再保留定义。
每个图表可以以.csv、.xlsx、.json和.png文件格式下载。点击图表右上角的三个点按钮,选择 下载结果:
-
要下载包含大数字的逗号分隔符的格式化结果,请从窗口中选择所需的文件格式。
-
要下载未格式化的结果,请按住Shift(Windows)或Option(Mac)键,并从窗口中选择所需的文件格式。
来自共享内容的数据在所有仪表盘中都受支持。
多个仪表盘包括所有权筛选器,以帮助区分组织拥有的数据和跨组织共享的数据:
-
筛选器识别组织是否为该工作的创建者。
-
由组织创建的工作(可能共享也可能不共享)。
-
与组织共享的工作,无论是谁创建的。
-
-
筛选器识别组织是否为LQA评估的创建者。
审查提供者被视为所有者,因此组织的视图将显示评估为。来自其他组织的用户(如翻译提供者、项目买方或供应商)将在下看到相同的评估。
如果提供者来自您的组织,则显示其用户名和全名。如果提供者来自不同的组织,则显示其用户ID和组织名称,如记分卡中所示。
-
筛选器识别组织是否为报价的创建者。
-
筛选器识别组织是否为分析的创建者。
图表显示组织的实际支出,基于定价指标(例如字数、字符数、页数或小时)并乘以价格列表。
成本仪表盘基于:
-
报价用于项目中的所有工作流步骤。
注释
为相同的工作流步骤创建新报价将覆盖之前创建的报价的数据。
-
所有项目的每小时报价和每个工作的最新标准报价。
在共享项目(或分配了服务商的报价)中,报价对所有用户可见,但最新报价可能因用户而异。
在为工作分配服务商时,请考虑:
-
如果在创建工作时分配了服务商,他们的价格列表将覆盖项目的价格列表。
-
如果稍后分配服务商,费用不会自动重新计算。
为分配的用户生成报价,以相应更新数据。
-
如果多个服务商被分配到工作部分,将使用第一个列出的服务商的数据。
生成新的报价以使用其他用户的定价信息。
选项卡提供了关于Phrase TMS和Strings、Phrase Portal以及通过API的Phrase Language AI的机器翻译单元和翻译字符消耗的洞察。它提供了按项目和工作流步骤的时间、区域对、机器翻译引擎和机器翻译个人资料的消耗概述。
访问时,默认显示Phrase TMS,但用户也可以通过调整Phrase产品仪表盘筛选器查看所有/特定Phrase产品的消耗。
TMS机器翻译来源筛选器显示了Phrase TMS中机器翻译单元的分布:
-
TMS预翻译
-
TMS分析
-
TMS CAT编辑器
图表显示了翻译记忆库(TM)、机器翻译(MT)、重复内容和非可翻译内容(NT)在工作中的利用情况。
利用率计算为在应用任何净计费方案之前,特定匹配类别中的字数与应用净计费方案后同一匹配类别中的字数之间的差异。
仪表盘基于:
-
来自默认分析的数据。
-
来自上次运行分析的任何给定工作的数据。
仅在项目或分配给工作的服务商添加了净计费方案时,数据才会生成,且在创建分析之前。如果项目或分析中的净计费方案发生更改,分析将显示最新信息。
在以下情况下,图表不显示数据:
-
没有净计费方案的项目和工作。
-
杠杆为0的分析(例如,针对项目、语言对等)。
-
包含内部模糊的分析。
-
已删除的分析。
仅计算属于查看者组织的用户创建的分析的数据。因此,当买方共享工作给供应商时,供应商创建分析:
-
买方在仪表盘中看不到与分析相关的数据。
-
由于供应商是分析的创建者,他们能够在仪表盘中看到相关数据。
质量性能分数在句段级别估算机器翻译质量,以确定哪些句段足够好以进行自动确认。这帮助组织自动检测低质量翻译,减少全面人工审查的需求。
预翻译的句段可以根据预翻译设置中设定的QPS阈值自动确认。QPS仅适用于通过语言AI翻译的机器翻译句段。
仪表盘帮助找到最佳的QPS阈值,以平衡成本节约和质量风险。
仪表盘中的过滤器有助于找到不同内容类别的最佳值,因为技术、法律和营销文本可能具有不同的质量要求。
这些见解基于句段级别的指标。自定义见解可以通过Phrase Data Premium解锁,该服务提供对原始句段级别数据的访问。
包含的数据
-
过去6个月,从2025年1月1日开始(跟踪开始时)
-
仅限语言AI,因为QPS仅适用于通过语言AI处理的机器翻译。
-
所有语言AI句段,无论来源(翻译前或编辑器建议)
-
QPS分数是通过语言AI翻译后给出的原始分数,而不是经过译员编辑后的分数。
-
买方(而非供应商)查看共享项目的数据。
过滤长编辑时间
偶尔,句段的编辑时间异常长。这可能是由于分心(例如,查看手机或休息)造成的。为了保持数据准确性,平均编辑时间约为20秒。应用50%的缓冲,并排除编辑时间超过30秒的句段。
虽然一些长时间编辑可能是合理的,但大多数都是异常值,会引入噪音。
过滤的影响:
-
在大型数据集上,过滤这些长句段的影响很小。
-
在较小的数据集上,效果更为明显,因为单个长时间编辑可能会不成比例地影响总编辑时间。
这种过滤确保了更清晰和更可靠的时间跟踪数据。
图表描述
-
图表 1:
显示在选定时间范围内,基于其质量评估分数的段落量的分布。
-
图表 2:
显示由语言学家编辑的段落的百分比。预计质量评估分数较高的段落会有更少的编辑。
-
图表 3:
显示语言学家编辑段落所花费的时间。
-
图表 4:
包括编辑和未编辑的段落(编辑时间为0的段落)。这提供了对所有处理段落所花费的整体努力的更清晰的了解,结合了前两个图表的见解。
-
图表 5:
估计如果降低质量评估分数阈值,将不会需要人工验证的自动批准单词的数量。例如,如果质量评估分数阈值从95降低到90,自动批准单词的平均数量可能会从950增加到1,750。
-
图表 6:
显示如果降低质量评估分数阈值可以节省多少编辑时间。
-
图表 7:
通过比较自动段落(自动确认或自动锁定)与编辑的机器翻译段落的百分比,跟踪随时间推移编辑段落的减少。它显示了自动化如何通过减少需要人工编辑的段落数量来提高效率。
仪表盘专注于 LQA 功能,并包括以独立行呈现的已完成评估结果。评估结果可能包含或不包含问题,图表基于工作创建日期。
仪表盘提供以下见解:
-
整个公司的平均质量得分和随时间变化的错误数量。
-
哪些类别具有最高严重程度的 LQA 错误。
-
哪些服务商保持高质量得分。
-
每个项目按严重程度划分的错误数量。
-
质量得分在不同语言对和客户之间的表现随时间变化。
LQA 错误计数包括重复问题。重复和非重复问题在项目和服务商表中分别显示。
在 LQA 和自动 LQA 见解之间有一个切换。
仪表盘显示供应商报价信息,用于工作付款,并包括所有状态为新、已核准、待批准和已拒绝的 报价。
已删除项目的报价不包括在仪表盘中。
-
是报价中所有工作的最低设定价格。
-
是报价中每个工作的发生价格。
-
显示实际支付的成本,平均分配到所有工作流程步骤、语言对等。
包含在仪表盘中(和 报价表):
-
工作报价在所有工作流程步骤中平均分配。这包括仅有一个工作流步骤的拆分工作的报价。
-
拆分之前创建的报价。
未包含在仪表盘(和报价表)中:
-
在所有工作流步骤中不均匀拆分的工作的报价。
该仪表盘比较来自报价的原始价格和净价格,以计算相关的节省。
当最低价格高于计算价格时,报价中使用最低价格。在这种情况下,节省等于零,因为净计费方案与最低价格无关。
如果存在最低收费,字数统计将不再适用。
注释
在遗留的仪表盘中,当最低价格为0时,节省被视为原始价格和净价格之间的差异。
该仪表盘关注按时与逾期工作的交付,基于创建的工作日期和工作到期日期。仪表盘包括所有有到期日期的按时和逾期工作,并且其最后状态不是已取消、已拒绝或被译员拒绝。
如果工作尚未标记为完成,则工作到期日期与当前日期进行比较。
数据在此仪表盘中可视化的两个前提条件:
-
工作需要有到期日期。
-
除了图表外,工作需要遵循正确的状态顺序 - 新建、已发邮件、已接受和已完成:
-
工作发邮件的日期/时间小于或等于服务商接受工作的日期/时间。
-
服务商接受工作的日期/时间小于或等于服务商交付或完成工作的日期/时间。
-
由于一个工作可以经历相同的状态多次,计算基于首次分配和最后一次接受及完成的实例。
注释
所有工作流步骤都在图表中计数。例如,如果工作有一个翻译步骤和一个修订步骤,每个步骤都根据其单独的状态进行计数(状态可能相同也可能不同)。
仪表盘提供以下见解:
-
按时间统计的准时和逾期工作的数量。
-
基于元数据跟踪工作交付 - 即,客户和领域。
-
哪些项目按计划进行,哪些项目未按计划进行。
-
哪些客户和服务商表现良好。
-
按语言对划分的工作分配、接受和完成的平均时间。这提供了对每种状态下通常需要更多或更少时间的语言的理解。
-
每个工作流步骤的平均编辑时间。
如果使用短语数据,状态命名不同,相关如下:
以下标准适用于数据:
-
由翻译记忆库或机器翻译预翻译的句段被包含在内。由翻译记忆库预翻译的句段必须得到确认。
-
包含多个工作部分的句段被视为一个句段并进行计数。编辑时间的总和来自所有工作部分的句段,并考虑到思考时间。
-
编辑时间超过30秒的句段不包括在编辑时间平均值中,但会计入预翻译句段图表的计数。
-
来自所有工作部分在某个时刻或的工作的句段被包含在内。
-
在过去6个日历月内创建的句段以及当前月份的句段被包含在内。
图表突出显示:
-
该图表显示预翻译句段的平均编辑时间。对于由翻译记忆库预翻译的句段,它显示按翻译记忆库匹配类别得分的编辑时间。对于由机器翻译预翻译的句段,水平线显示机器翻译句段的平均编辑时间。这应该有助于指示设置阈值的最佳值。
-
未编辑的句段以0编辑时间计入。
-
翻译记忆库匹配得分被分组为类别(0-69%、70-74%、...、95-99%、100-101%),以更好地呈现数据。
-
-
该图表显示来自所有来源的预翻译句段的整体平均编辑时间。这可以用来检查阈值的变化是否有影响。调整阈值应导致编辑时间减少。
-
此图表显示经过预翻译的段落数量以及TM返回的匹配类别分数。
筛选条件包括:
这些图表提供了洞察,帮助通过识别最佳TM阈值来最小化语言工作量,并应作为利用自动化的起点。设置多个筛选组合可能会导致显示的小部分段落不包含足够的数据以提供确凿的洞察。
字数统计考虑了在TMS中处理(上传)的所有源词,例如在提交时、创建工作时或进行持续本地化和更新源时。调整仪表盘筛选器以包括已删除或废弃的工作。对于持续工作,计算基于最后版本中的所有源词。
仪表盘提供了处理字数的洞察:
-
在订购套餐中使用的字数。
-
每月的字数消耗。
-
单词在提供者之间的分布。
-
哪些语言对占据了最高的字数。
-
按元数据(如客户和域)拆分的字数。
项目创建者或工作创建者的字数可以通过可自定义的图表显示,这些图表在高级分析中可用。
如果需要,可以根据字符或的计数查看图表,而不是字数。通过切换选择所需的指标,以在图表中显示相关数据。
由于不同语言之间的计数方法不同,所呈现的字数可能与其他应用程序生成的字数不同。
用于分析的字数与MTU计算的字数不同。
-
每个合并标签被替换为一个空格。
-
其他标签被移除。
在使用空格分隔单词的语言中(例如,英语):
-
每个包含
+-,.的数字序列被替换为一个字符(使用正则表达式表达式[+-]?[0-9]+([., -]?[0-9]++)*+)。 -
每个空格序列被替换为一个空格。
-
段落开头和结尾的空格被移除。
-
每个与空格不同的字符序列被计为一个单词。
在不使用空格分隔单词的语言中(例如,日语):
-
一些标点符号从文本中移除(使用正则表达式
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}])。 -
段落被拆分为属于非空格(NWS)汉字、平假名、片假名和泰文字符的序列,以及不属于这些字符的序列(WS)。
-
总字数 = (NWS中的字数) + (WS中的字数)。
-
WS的单词数计算方式与英语相同。
-
NWS的单词数是去掉空格后的字符数。
-
对于泰语,单词数是去掉空格后的字符数除以2。
如果需要其他仪表盘标准,欢迎提交一个功能请求。