Phrase Studio

配音(工作室)

文本由 Phrase Language AI 从英语机器翻译而得。

配音将文件中的原始音频替换为不同语言的新版本,同时保留原始说话者的声音特征和情感语调。

正确的说话者分配是配音工作流程所必需的。如果使用导入的字幕文件跳过自动音频转录,请确保在进行配音之前分配所有说话者。

使用案例

  • 一家媒体公司希望在西班牙和日本发行一部原本为英语的纪录片。该平台的AI识别每位说话者,转录并翻译对话,然后生成西班牙语和日语的新音轨。生成的声音保留了原始说话者的特质,为新观众创造了真实的观看体验。

要为文件创建配音,请按照以下步骤操作:

  1. 在编辑器中,点击配音选项卡下的箭头,然后选择添加配音

    添加配音窗口打开。

  2. 从下拉列表中选择所需的翻译语言。

    注释

    如果选择了区域语言变体(例如,法语(加拿大)或葡萄牙语(巴西)),系统会自动回退到相应的基础语言进行配音。

    区域语言选择仍然保留在项目和元数据中。

  3. 可选地,启用应用发音规则以提高文本到语音的准确性,以选择现有的发音及相关配对用于配音工作流程。

  4. 点击添加配音

    窗口关闭,配音选项卡指示配音何时完成。

点击配音更改以更新配音与文本的任何更改。

点击管理声音以选择不同的配音。对于每种语言,最多会根据性别和年龄匹配自动建议7个推荐语音。

音频和配音控制

音频控制通过标记关键的声音细微差别来帮助使配音更加生动和准确,从而添加副语言信息。右键单击一个句段以在所需位置添加音频控制<1>,选择一个或多个可用选项。

注释

音频控制可能不适用于所有语言或语音模型。建议使用所选语音进行测试以确认兼容性。

测试后进行的音频调整或重配音不会消耗额外分钟

当一个项目包含多个说话者时,可以在配音选项卡中为每个说话者轨道和单独的句段调整配音设置。

  • 说话者轨道控制

    • 音量

      单击波形中所需说话者名称旁边的音量图标volume.jpeg以调整音量滑块。该调整适用于该说话者所说的所有句段。

  • 句段控制

    • 音量

    • 稳定性

      控制生成的声音听起来有多一致和可预测。

    • 相似性

      控制生成的声音与所选语音配置文件的匹配程度。

    在时间轴中选择一个句段以打开句段设置面板,并根据需要调整配音设置。单击立即保存配音选项卡的右上角以保存更改。

    在调整稳定性相似性后需要重新配音。点击 配音更改 以应用更新的设置。

调整配音速度

默认情况下,配音以 1× 速度生成,这意味着系统根据句段中的文本量确定最自然的说话节奏。

当前速度显示为时间轴上每个气泡的标签。

如果需要,有两种方法可以调整配音速度:

  1. 在波形上延长或缩短气泡:

    示例

    如果配音音频在 1× 速度下超出预期场景,请拖动气泡的结束时间。配音会稍微加快以适应句段,速度标签也会相应更新。

  2. 编辑文本并重新配音:

    示例

    如果音频在 1× 速度下显著溢出,句段可能包含过多文本。重写文本并配音更改。

发音

发音控制配音音频中特定单词或短语的发音方式。它们确保品牌名称、技术术语、缩略词和外语单词的一致发音。

可以定义自定义发音对,并在 项目创建 期间将其应用于配音工作流程。

对于现有项目,在编辑器的 配音 选项卡中添加新配音语言时,也可以选择发音。

发音会以只读模式自动与同一组织的所有用户共享。

先决条件

  • 该项目的 目标语言 支持配音。

  • 已将配音语言添加到项目中。

要创建发音,请按照以下步骤操作:

  1. 设置页面中,选择发音选项卡。

  2. 点击创建新发音

    将显示创建发音窗口。

  3. 输入发音名称和可选的描述

  4. 选择可用的以使发音可用于项目选择。

  5. 点击保存

    发音将列在发音选项卡中。

每个发音可以包含一个语言的多个配对。要添加发音配对,请按照以下步骤操作:

  1. 选择一个现有的发音,然后点击创建新配对

  2. 提供原始源语单词或短语。

  3. 译文字段中定义所需的发音。

    使用音标拼写、音节分隔或近似音。

  4. 选择相关语言。

  5. 可选地,点击预览以收听并根据需要进行调整。

  6. 点击保存

    新配对已添加到所选发音中。

可以通过选择发音或配对旁边的编辑来更新或删除现有发音及相关配对。

更新发音配对后重新运行配音;之前渲染的音频将不会自动更改。

发音示例

  • 品牌名称

    • 苹果:ap-pul

    • 微软:mai-kroh-soft

  • 技术术语

    • GIF:jif

    • SQL:ess-cue-el

  • 外来词

    • 可颂:krwa-san

    • 圣保罗:sow-pow-loo

语音克隆

语音克隆基于真实说话者的录音生成合成语音。克隆的声音可以用于AI配音,使翻译后的音频保留原说话者的语调和声音特征。

克隆过程使用上传的音频或视频样本中选择的语音范围来训练语音模型。样本处理后,可以生成预览,然后再保存语音。

语音克隆在我的声音选项卡的设置页面中创建和管理。一旦创建,语音便可用于配音工作流程。

语音样本要求

  • 总选择范围持续时间必须在15到180秒之间

  • 最大上传文件时长:5分钟

  • 最大样本文件:3

  • 每个文件最大大小:30 MB

  • 最大样本范围:50

  • 如果语音样本包含多个说话者,则必须使用范围来隔离单个说话者的样本。

要创建语音克隆,请按照以下步骤操作:

  1. 我的声音选项卡的设置页面中,单击创建新声音

    显示创建您的声音部分。

  2. 上传样本以生成语音克隆。

    上传的媒体在波形播放器中显示,可以标记范围。

  3. 使用时间轴定义包含说话者声音的范围,然后单击完成

    所选范围已确认。可以通过单击添加范围以相同方式上传和处理其他文件。

    注释

    仅使用所选范围生成语音克隆。

  4. 选择同意复选框并确认

  5. 单击下一个

    显示语音详细信息步骤。

  6. 输入语音名称。可选地,提供语音描述性别标签以进行分类。

  7. 单击下一个

    显示预览步骤。第一个预览会自动生成。

  8. 选择一个预览语言并提供预览文本

  9. 点击预览声音

    音频样本已生成。这通常需要几秒钟。

  10. 点击保存

    新声音已添加到我的声音列表中。

现有的声音克隆可以在我的声音选项卡中预览或删除。

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.