短语数据分为两个级别:
-
基础
-
高级
高级级别提供与基础级别相同的访问权限,并且可以访问段级数据。
云数据仓库(如 Snowflake)使客户能够通过 SQL 接口安全地访问他们的数据。
短语数据展示与客户使用 TMS 相关的数据,从客户首次订阅短语的日期到当前日期。短语保留在通知客户的情况下更改数据展示周期的权利。
短语数据集成的完整技术文档。
短语数据有助于战略决策,展示商业影响,并可以证明投资的合理性。数据可以与更广泛的公司指标结合,以揭示对收入、市场渗透和客户满意度的影响:
-
网站流量,如页面浏览量、跳出率、用户人口统计。
-
营销数据,如点击率、转化率、社交媒体参与度。
-
客户支持数据,分析本地化支持材料是否能导致更快的问题解决和更高的客户满意度。
-
销售数据,比较成本与本地化内容所产生的收入。
洞察有助于理解全球内容的覆盖范围和声誉,并确保公司的信息在不同语言中成功传达。
-
本地化努力的投资回报率(ROI)
用于支持维护或增加预算,证明翻译投资带来了回报。它还指出了成本节约,例如使用机器翻译节省的资金如何随着时间的推移对整体投资回报率产生贡献。
-
内容适应性、有效性和用户参与度
了解本地化内容在受众中的表现。跟踪每个区域的客户保留率表明翻译满足了用户需求。这些反馈可以影响团队的质量策略或如何调整风格以更好地与本地用户产生共鸣。 客户用例将内容适应与参与指标相关联。通过使用不同的提示与AutoAdapt根据人口统计(例如年龄、性别、地区、语言)个性化内容,这将跟踪在本地或活动层面的表现提升。
-
市场和语言优先级
帮助决定应集中在哪些语言或地区以获得最大影响。确保团队将资源分配给能够带来最大商业回报的翻译。还可以指导新语言推出的顺序,或为希望增长的市场证明本地化的必要性。
-
流程优化与技术战略
评估工作流持续时间和自动化影响,促进持续的流程改进,并帮助选择合适的技术。衡量机器翻译在质量和速度方面的使用增加(例如,译后编辑时间和质量得分)量化生产力提升。
-
内部绩效基准
随着时间的推移,内部基准如每字平均成本、特定内容类型的平均周转时间和平均质量得分成为改进的战略目标。它揭示了智能实践和效率提升的结果,进一步证明了本地化项目的合理性。
将短语数据与编排器工作流连接,以更高效地运行重查询和高级自动化。编排器集成还通过快速抽样项目或识别符合特定标准的工作,帮助简化质量检查和流程优化。
在任何依赖翻译和语言本地化的行业中,团队需要强大的数据洞察来指导决策。然而,分析报告和洞察因团队需求(本地化、内容、执行利益相关者)而异,他们需要操作指标(每日效率、吞吐量、成本)和战略洞察(长期投资回报、用户影响、市场增长)。
操作分析帮助本地化经理简化工作流程并每日管理成本。
-
量(也称为吞吐量)
跟踪一段时间内翻译的内容量(例如每周/月的单词数)可以指示团队的能力。这有助于资源规划。
-
及时性(也称为周转时间)
周转时间衡量从开始到完成翻译内容所需的时间。本地化团队跟踪翻译是否按时交付或面临延迟。这对于满足产品发布日期、服务水平协议和调查延迟至关重要。
-
供应商和译员表现
如果使用外部翻译供应商或自由职业译员,本地化团队将希望评估他们的表现。跟踪每个供应商的周转时间、按时交付和每个译员的质量评分等指标。
-
质量指标(语言质量保证)
衡量第一次尝试通过质量检查的翻译百分比(无需返工),表明初始翻译有效。同样,详细说明发现的错误问题的类别和严重程度,例如术语、准确性等。
-
成本和效率指标
通常,团队通过项目、语言或部门跟踪每个单词的成本和总支出,以确保预算得到满足。以及比较原始翻译成本与应用净计费方案后的折扣成本的节省,突显维护翻译记忆库匹配和重复的价值。 例如,如果新项目中有30%的单词通过100%翻译记忆库匹配进行翻译,团队可以量化不重新翻译这些句段所节省的成本。
-
利用自动化(机器翻译和翻译记忆库)
-
译后编辑工作,例如对机器翻译输出所需的平均编辑次数或时间,以帮助评估机器翻译。
-
通过查看翻译记忆库匹配的内容百分比来评估翻译记忆库的利用率,这表明翻译记忆库的重用效率和成本节省。
-
机器翻译的使用率,例如最初由机器翻译翻译的句段百分比。这展示了自动化的覆盖范围和成本/时间减少的机会 - 仅限高级。
-
翻译记忆库(TM)利用率
跟踪翻译记忆库最后一次使用的时间以及随时间重用的句段数量。这有助于评估翻译记忆库的新鲜度、价值贡献,以及过时的翻译记忆库是否仍然值得维护。
建议的分析:
-
使用并过滤
translation_origin = TM。-
可以使用
translation_memory_id来识别翻译记忆库。 -
按翻译记忆库聚合句段,并使用
date_created字段查看翻译记忆库的使用时间。计算并查看平均editing_time_ms和score也是很好的。
-
-
使用
job_id与连接,以提取语言信息,例如target_locale。 -
使用
project_id与2连接,以按领域、客户、业务部门等上下文化使用。
收益:
-
成本节约: 帮助淘汰未使用或表现不佳的翻译记忆库,以减少维护开销。
-
质量: 识别高后编辑工作量的老化翻译记忆库,并标记适当的行动。
-
效率: 使用高效的翻译记忆库,减少编辑时间并增加自动确认。考虑相应地调整翻译记忆库的阈值。
机器翻译(MT)引擎优化
通过QPS(每个句段的质量得分)和后编辑时间比较机器翻译引擎,从而更智能地将内容路由到合适的机器翻译引擎。
建议的分析:
-
使用 ,过滤条件为
翻译来源 = MT。 -
与 合并,使用
机器翻译设置ID。-
可以使用
机器翻译设置名称来识别机器翻译引擎。 -
按机器翻译引擎聚合句段,并计算
句段ID的总和、平均QPS和平均编辑时间毫秒。
-
-
使用
job_id与连接,以提取语言信息,例如target_locale。 -
与 合并,以处理不同的内容类型,如领域、客户、业务部门等。
收益:
-
降低成本: 确定并使用适合内容类型和语言的合适引擎,这些引擎在历史上具有较低的编辑率。
-
量化周转时间: 通过查看每种语言对、内容类型等的编辑时间。
最大化自动确认的句段(即无需处理的内容)
识别高QPS且无编辑时间的最有效点,以便尽可能多地将内容与人类审查分开。
建议的分析:
-
使用 :
-
过滤条件为句段
翻译来源 = MT,已确认 = true,编辑时间毫秒 = 0,和确认来源 = MT。 -
按
QPS聚合句段计数 (句段ID),字数 (处理字数)。 -
使用
job_id与连接,以提取语言信息,例如target_locale。 -
与 合并,使用
项目ID提取内容元数据。
-
收益:
-
成本节约: 找到最佳QPS阈值,以提高自动确认并减少编辑时间,同时确保质量已经足够好。
-
减少周转时间: 避免内容被不必要地审校。
查询模板
作为指导的示例查询,以帮助开始使用相关表格:
选择
ssv.qps
,DATE(DATE_TRUNC('month', ssv.date_created)) AS date_month
,COUNT(DISTINCT segment_id) AS mt_segments
FROM segment_statistic_v2 ssv
WHERE
ssv.date_created >= DATEADD('day', -365, CURRENT_DATE)
AND ssv.date_created < CURRENT_DATE
AND ssv.translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
ssv.qps
,DATE(DATE_TRUNC('month', ssv.date_created));
选择
ssv.qps
,pcmv.custom_field_name
,pcmv.custom_field_values
,COUNT(DISTINCT segment_id) AS mt_segments
FROM segment_statistic_v2 ssv
JOIN job_v2 jv
ON ssv.job_id = jv.job_id
JOIN project_custom_metadata_v2 pcmv
ON jv.project_id = pcmv.project_id
WHERE
ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
AND ssv.date_created < CURRENT_DATE
AND ssv.translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
ssv.qps
,pcmv.custom_field_name
,pcmv.custom_field_values;
选择
ssv.qps
,jv.locale_pair
,COUNT(DISTINCT segment_id) AS mt_segments
FROM segment_statistic_v2 ssv
JOIN job_v2 jv
ON ssv.job_id = jv.job_id
WHERE
ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
AND ssv.date_created < CURRENT_DATE
AND ssv.translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
ssv.qps
,jv.locale_pair;
选择
ssv.qps
,mtsv.machine_translate_setting_type
,COUNT(DISTINCT segment_id) AS mt_segments
FROM segment_statistic_v2 ssv
JOIN machine_translate_setting_v2 mtsv
ON ssv.machine_translate_setting_id = mtsv.machine_translate_setting_id
WHERE
ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
AND ssv.date_created < CURRENT_DATE
AND ssv.translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
ssv.qps
,mtsv.machine_translate_setting_type;
选择
qps
,COUNT(DISTINCT segment_id) AS mt_segments
,COUNT(DISTINCT IFF(LOWER(confirmation_source) IN ('mt', 'tm', 'nt', 'ir', 'ut'), segment_id, NULL)) AS mt_segments_autoconfirmed
FROM segment_statistic_v2
WHERE
date_created >= DATEADD('day', -28, CURRENT_DATE)
AND date_created < CURRENT_DATE
AND translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
qps;
选择
qps
,COUNT(DISTINCT segment_id) AS mt_segments
,COUNT(DISTINCT IFF(COALESCE(editing_time_ms, 0) > 0, segment_id, NULL)) AS mt_segments_edited
FROM segment_statistic_v2
WHERE
date_created >= DATEADD('day', -28, CURRENT_DATE)
AND date_created < CURRENT_DATE
AND translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
QPS;
WITH qps_segments AS (
选择
ssv.qps
,SUM(words_processed) AS words_processed
FROM segment_statistic_v2 ssv
WHERE
ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
AND ssv.date_created < CURRENT_DATE
AND ssv.translation_origin = 'mt' -- 由机器翻译预翻译的句段
GROUP BY
ssv.qps
)
选择
qps AS new_qps_threshold
,SUM(words_processed) OVER (ORDER BY qps DESC) AS words_saved
FROM qps_segments;