Phrase Data (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

Phrase Data 提供两个层级：

基础
可用于
- Team、Professional、Business、Enterprise 和 Software UI/UX 计划
关于许可问题，请联系销售团队。
Premium

Premium 层级提供与 Basic 层级相同的访问权限，外加对句段级数据的访问权限。
可用于
- Business 和 Enterprise 套餐
关于许可问题，请联系销售团队。
包含在
- Enterprise 套餐（原）
关于许可问题，请联系销售团队。

云数据仓库（例如 Snowflake）使客户能够通过 SQL 接口安全地访问其数据。

Phrase Data 显示与客户使用 TMS 相关的数据，时间范围从客户首次订阅 Phrase 之日起至当前日期。Phrase 保留更改数据显示期限的权利，并将通知客户。

Phrase Data 集成的完整技术文档。

Phrase Data 有助于战略决策，展示 Business 影响并可证明投资的合理性。数据可以与更广泛的公司指标相结合，以揭示对收入、市场渗透率和客户满意度的影响：

网络流量，例如页面浏览量、跳出率、用户人口统计数据。
营销数据，例如点击率、转化率、社交媒体参与度
客户支持数据，分析本地化支持内容是否能带来更快的问题解决速度和更高的客户满意度。
销售数据，比较成本与本地化内容产生的收入。

洞察有助于了解全球内容在全球范围内的影响力和声誉，并确保公司的信息在不同语言中取得成功。

本地化工作的投资回报率 (ROI)

用于通过证明翻译投资能带来回报，从而支持维持或增加预算。它还指出了成本节约，例如随着时间的推移，使用机器翻译如何节省资金并有助于整体投资回报率。
内容适应性、有效性和用户参与度

了解本地化内容在受众中的表现。跟踪每个区域的客户留存率表明翻译满足了用户需求。此反馈可以影响 Team 的质量策略，或影响如何调整风格以更好地与当地用户产生共鸣。一个客户使用案例将内容适配与参与度指标相关联。通过对 AutoAdapt 使用不同的提示词，根据人口统计数据（例如年龄、性别、区域、语言）来个性化内容，这将跟踪本地或营销活动层面的绩效提升。
市场和语言优先级排序

有助于决定重点关注哪些语言或区域以实现最大影响力。它确保 Team 将资源分配给能带来最大 Business 回报的翻译。还可以指导新语言推出的顺序，或为他们想要发展的市场证明本地化的合理性。
流程优化与技术策略

评估工作流持续时间和自动化影响有助于持续改进流程，并帮助选择合适的技术。衡量机器翻译在质量和速度（例如译后编辑时间和质量得分）方面使用量的增加，可以量化生产力收益。
内部绩效基准测试

随着时间的推移，内部基准（如平均每字成本、特定内容类型的平均周转时间以及平均质量得分）将成为战略改进目标。它揭示了智能实践和效率提升的结果，从而进一步证明了本地化项目的合理性。

将 Phrase Data 与 Orchestrator 工作流集成，以更高效地运行繁重的查询和高级自动化。Orchestrator 集成还通过对项目进行抽样或更快地识别符合特定条件的作业，帮助简化质量检查和流程优化。

基础层级使用案例

在任何依赖翻译和语言本地化的行业中，Team 都需要强大的数据洞察来指导决策。然而，分析报告和洞察因 Team 需求（本地化、内容、高管利益相关者）而异，他们需要运营指标（日常效率、吞吐量、成本）和战略洞察（长期投资回报率、用户影响、市场增长）。

运营分析帮助本地化经理简化工作流程并管理日常成本。

数量（也称为吞吐量）

跟踪一段时间内翻译的内容量（例如每周/每月字数）可以反映Team的产能。这有助于资源规划。
及时性（也称为周转时间）

周转时间衡量从开始到完成翻译内容所需的时间。本地化Team会跟踪翻译是按计划交付还是面临延误。这对满足产品发布日期、服务等级协议（SLA）以及调查延误至关重要。
供应商和译员表现

如果使用外部翻译供应商或自由译员，本地化Team将需要评估他们的表现。跟踪诸如每个供应商的周转时间、每个供应商的按时交付率以及每个译员的质量评分等指标。
质量指标 (语言质量保证)

衡量首次通过QA检查（无需返工）的翻译百分比，这表明了有效的初始翻译。同样，详细说明发现的错误问题的类别和严重程度，例如术语、准确性等。
成本和效率指标

通常，Team会跟踪每个项目、语言或部门的每字成本和总支出，以确保符合预算。以及通过比较原始翻译成本与应用净计费方案后的折扣成本来计算节省的费用，从而突显维护翻译记忆库匹配和重复项的价值。例如，如果一个新项目中有30%的字数是通过100%翻译记忆库匹配翻译的，Team可以量化通过不对这些片段进行重新翻译所节省的成本。
自动化的利用（机器翻译和翻译记忆库）
- 译后编辑工作量，例如在机器翻译输出上所需的平均编辑量或时间，以帮助评估机器翻译。
- 通过查看翻译记忆库匹配的内容百分比来计算翻译记忆库杠杆率，这表明了翻译记忆库的重用效率和成本节约情况。
- 机器翻译使用率，例如最初由机器翻译翻译的句段百分比。这展示了自动化覆盖范围以及降低成本/时间的各种机会——仅限高级版。

高级层级使用案例

翻译记忆库 (TM) 利用率

跟踪翻译记忆库的最后使用时间以及随时间推移重用的句段数量。这有助于评估翻译记忆库的新鲜度、价值贡献，以及过时的翻译记忆库是否仍值得维护。

建议分析：

使用 segment_statistic_v2 并筛选 translation_origin = TM。
- 可以使用 translation_memory_id 来识别翻译记忆库。
- 按翻译记忆库聚合句段，并使用 date_created 字段查看翻译记忆库的使用时间。计算并查看平均 editing_time_ms 和 score 也是有益的。
使用 job_id 与 job_v2 合并，以提取语言信息，例如 target_locale。
使用 project_id 与 project_v2 合并，以按领域、客户、业务部门等对使用情况进行情境化分析。

收益

成本节约： 有助于淘汰未使用的或表现不佳的翻译记忆库，以减少维护开销。
质量： 识别需要大量译后编辑工作的老化翻译记忆库，并标记出合适的行动。
效率： 使用能减少编辑时间并提高自动确认率的高性能翻译记忆库。考虑相应地调整翻译记忆库阈值。

机器翻译 (MT) 引擎优化

通过 QPS（质量评估分数）（每个句段的质量得分）和译后编辑时间来比较机器翻译引擎，从而能够更智能地将内容路由到合适的机器翻译引擎。

建议分析：

使用 segment_statistic_v2 并对 translation_origin = MT 进行筛选。
使用 machine_translate_setting_id 与 machine_translate_setting_v2 合并。
- 可以使用 machine_translate_setting_name 来识别机器翻译引擎。
- 按机器翻译引擎聚合句段，并计算 segment_id 的总和、平均 QPS（质量评估分数）以及平均 editing_time_ms。
使用 job_id 与 job_v2 合并，以提取语言信息，例如 target_locale。
与 project_v2 合并，以获取领域、客户、业务部门等不同内容类型。

收益

降低成本： 识别并使用最适合该工作内容类型和语言的引擎，这些引擎在历史上具有较低的编辑率。
量化周转时间： 通过查看每个语言对、内容类型等的编辑时间。

最大化自动确认句段（即无需人工干预的内容）

确定最高效的点，即高 QPS（质量评估分数）且无编辑时间的内容符合自动确认条件，从而尽可能多地将内容从需要人工审校中分离出来。

建议分析：

使用 segment_statistic_v2：
- 筛选句段 translation_origin = MT、is_confirmed = true、editing_time_ms = 0 以及 confirmation_source = MT<4>} 的内容。
- 按 QPS（质量评估分数） 聚合句段计数 (segment_id) 和字数统计 (words_processed)。
- 使用 job_id 与 job_v2 合并，以提取语言信息，例如 target_locale。
- 使用 project_id 与 project_v2 合并以提取内容元数据。

收益

成本节约： 找到最佳 QPS（质量评估分数）阈值，以提高自动确认率并减少编辑时间，从而在质量已经足够好的情况下减少工作量。
缩短周转时间： 避免内容被不必要地审校。

查询模板

用作指南的示例查询，以帮助您开始使用相关表：

逐月预翻译的机器翻译输出

选择
    ssv.qps
    ,DATE(DATE_TRUNC('month', ssv.date_created)) AS date_month
    ,COUNT(DISTINCT segment_id) AS mt_句段
FROM segment_statistic_v2 ssv
WHERE
    ssv.date_created >= DATEADD('day', -365, CURRENT_DATE)
    AND ssv.date_created < CURRENT_DATE
    AND ssv.translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    ssv.qps
    ,DATE(DATE_TRUNC('month', ssv.date_created));

跨自定义项目元数据的预翻译机器翻译质量差异

选择
    ssv.qps
    ,pcmv.custom_field_name
    ,pcmv.custom_field_values
    ,COUNT(DISTINCT segment_id) AS mt_句段
FROM segment_statistic_v2 ssv
JOIN job_v2 jv
    ON ssv.job_id = jv.job_id
JOIN project_custom_metadata_v2 pcmv
    ON jv.project_id = pcmv.project_id
WHERE
    ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
    AND ssv.date_created < CURRENT_DATE
    AND ssv.translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    ssv.qps
    ,pcmv.custom_field_name
    ,pcmv.custom_field_values;

跨区域设置的预翻译机器翻译质量差异

选择
    ssv.qps
    ,jv.locale_pair
    ,COUNT(DISTINCT segment_id) AS mt_句段
FROM segment_statistic_v2 ssv
JOIN job_v2 jv
    ON ssv.job_id = jv.job_id
WHERE
    ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
    AND ssv.date_created < CURRENT_DATE
    AND ssv.translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    ssv.qps
    ,jv.locale_pair;

预翻译机器翻译量与质量

选择
    ssv.qps
    ,mtsv.machine_translate_setting_type
    ,COUNT(DISTINCT segment_id) AS mt_句段
FROM segment_statistic_v2 ssv
JOIN machine_translate_setting_v2 mtsv
    ON ssv.machine_translate_setting_id = mtsv.machine_translate_setting_id
WHERE
    ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
    AND ssv.date_created < CURRENT_DATE
    AND ssv.translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    ssv.qps
    ,mtsv.machine_translate_setting_type;

经QPS（质量评估分数）自动确认的预翻译机器翻译句段数量

选择
    qps
    ,COUNT(DISTINCT segment_id) AS mt_句段
    ,COUNT(DISTINCT IFF(LOWER(confirmation_source) IN ('机器翻译', '翻译记忆库', '非译元素', 'ir', 'ut'), segment_id, NULL)) AS mt_句段_自动确认
FROM segment_statistic_v2
WHERE
    date_created >= DATEADD('day', -28, CURRENT_DATE)
    AND date_created < CURRENT_DATE
    AND translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    qps;

经QPS（质量评估分数）编辑的预翻译机器翻译句段数量

选择
    qps
    ,COUNT(DISTINCT segment_id) AS mt_句段
    ,COUNT(DISTINCT IFF(COALESCE(editing_time_ms, 0) > 0, segment_id, NULL)) AS mt_segments_edited
FROM segment_statistic_v2
WHERE
    date_created >= DATEADD('day', -28, CURRENT_DATE)
    AND date_created < CURRENT_DATE
    AND translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
GROUP BY
    QPS（质量评估分数）;

通过降低QPS（质量评估分数）阈值节省的人工审校字数

WITH qps_segments AS (
    选择
        ssv.qps
        ,SUM(words_processed) AS words_processed
    FROM segment_statistic_v2 ssv
    WHERE
        ssv.date_created >= DATEADD('day', -28, CURRENT_DATE)
        AND ssv.date_created < CURRENT_DATE
        AND ssv.translation_origin = '机器翻译' -- 由机器翻译预翻译的句段
    GROUP BY
        ssv.qps
)

选择
    qps AS new_qps_threshold
    ,SUM(words_processed) OVER (ORDER BY QPS（质量评估分数） DESC) AS words_saved
FROM qps_segments;

Phrase Data (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

可用于

可用于

包含在

基础层级使用案例

高级层级使用案例

翻译记忆库 (TM) 利用率

机器翻译 (MT) 引擎优化

最大化自动确认句段（即无需人工干预的内容）

查询模板

逐月预翻译的机器翻译输出

跨自定义项目元数据的预翻译机器翻译质量差异

跨区域设置的预翻译机器翻译质量差异

预翻译机器翻译量与质量

经QPS（质量评估分数）自动确认的预翻译机器翻译句段数量

经QPS（质量评估分数）编辑的预翻译机器翻译句段数量

通过降低QPS（质量评估分数）阈值节省的人工审校字数