我们提供了许多家机器翻译服务商的集成。通过与 DeepL、Amazon Translate 和 Google 翻译等第三方机器翻译引擎建立直接连接,用户可以将机器翻译与 Phrase Language AI Orchestratoror 一起使用。
机器翻译原始输出
如果不需要完美的翻译,例如内部沟通,可以使用机器翻译原始输出。根据翻译记忆库的质量,即使是机器翻译原始输出也可以有一定的质量。机器翻译原始输出在预翻译时生成。
机器翻译译后编辑 (MTPE)
高质量的翻译需要专业语言专家对机器翻译原始输出进行审校和编辑。翻译工作流应包括机器翻译、编辑和审校流程以及管理和客户通知。译后编辑翻译决策会保存在翻译记忆库和术语库中,供重复使用。
页面显示与个人资料关联的所有机器翻译引擎的字符用量图表。
机器翻译字符的用量是根据原文文本(包括空格)和确认没有替代翻译的句段(根据设置)计算的。
通过取消选择图表底部其他引擎的名称,可以查看特定引擎的数据。图表仅显示过去 30 天的数据。
默认情况下,项目经理只能看到与自己创建的项目相关的数据。
如果未使用 Phrase Language AI,可通过 API 访问第三方机器翻译引擎。若在 Phrase 中使用第三方机器翻译,请确保您已阅读并理解了相关机器翻译服务商的条款和条件。某些机器翻译引擎有特别的限制。
要设置新机器翻译引擎,请让管理员用户参考以下步骤:
-
从设置
页面,下拉到 部分。
-
点击机器翻译引擎。
页面打开。
-
点击创建。
窗口打开。
-
从下拉列表中选择机器翻译引擎类型,然后单击创建。
页面打开。
-
根据机器翻译引擎类型填写必填字段。
-
选择相关选项(并非适用所有机器翻译引擎类型)
-
添加标签(键和值)
-
包括标签
-
设为默认
-
-
点击保存。
该引擎已添加到机器翻译引擎列表。
一些机器翻译引擎仅供私人使用,一些引擎只能使用特定版本访问。
通过 API 筛选和提取翻译记忆库中的原始数据,用于训练自定义机器翻译引擎。
API 文档
数据清洗流程:
-
从翻译记忆库下载指定区域对的原始数据。
-
数据筛选后,
原文和译文相同的句段与标签一起被丢弃,重复数据被删除。
中日韩语言的筛选则更为简单。
-
原文和译文语义相似度最低的 10% 的数据会被移除。
丢弃数据的比例可以使用
preserveRatio
定义。 -
根据
outputFormat
设置将数据转换为 TXT/TSV。
清洗标准:
-
最小/最大长度
每个句段需要至少 5 个字符和至少 3 个字母。句段必须少于 1000 个字符。不符合条件的句段将被丢弃。
-
长度比
特定语言。
原文句段长度与译文句段长度之比不能大于 2。
示例:
如果原文句段有 30 个字符,而译文句段有 70 个字符,则该句段对将被丢弃。
-
LASER 分数
使用 LASER 体系为通过初步检查的句段打分,并根据分数排序。保留得分超过 90% 的句段对。LASER 会自动检测两种不同语言的句子是否相似,该检查主要针对错位/造成干扰的翻译记忆库条目。
-
Alexa Translations A.I.(原名 Yappn)
-
Amazon Translate
-
Apertium
-
闭环 NMT
-
CrossLang
-
DeepL Pro Advanced 和 DeepL Pro Ultimate(联系 DeepL 的支持团队以获取适用于 CAT 工具的 API v1 秘钥)
-
Fair Trade Translation
-
Globalese
-
Globalese NMT(神经机器翻译)
-
Google AutoML
注释
在 Phrase Language AI 中添加 Google AutoML 时,由于对机器翻译词汇表的支持和潜在用途,存储名称是必填信息。
-
Google Translate
重要
自 2020 年 11 月 3 日起,所有选择了 Google 翻译引擎的新项目都将默认自动使用 Google 的神经机器翻译 (NMT) 引擎,而不是 Google 的统计机器翻译 (SMT) 引擎。
-
Human Science
-
KantanMT
-
Kodensha MT
-
语言编辑(原名 SDL BeGlobal)
-
微软 Custom Translator(在 Microsoft Azure 中,将位置设置为“全球”)
-
Microsoft Translator / Microsoft Translator Hub
-
Mirai Translator
-
MoraviaMT
-
NICT
-
NpatMT
-
Omniscien Technologies
-
PangeaMT
-
PROMT
-
Rozetta T-3MT
-
Rozetta T-4OO
-
SDL Language Cloud
-
Skrivanek
-
Sunda MT
-
SYSTRAN
-
Systran PNMT
-
T-tact AN-ZIN
-
Tauyou
-
Tauyou Real-time
-
腾讯 TranSmart
重要
只能通过 Phrase Language AI 使用。支持中到英和英到中翻译(仅限简体中文)。
-
Tilde MT
-
东芝
-
Ubiqus NMT
-
Yandex