Phrase Studio

配音(工作室)

文本由 Phrase Language AI 从英语机器翻译而得。

配音将文件中的原始音频替换为不同语言的新版本,同时保留原始说话者的声音特征和情感语调。

正确的说话者分配是配音工作流所必需的。如果使用导入的字幕文件跳过自动音频转录,请确保在进行配音之前分配所有说话者。

使用场景

  • 一家媒体公司希望在西班牙和日本发行一部原本为英语的纪录片。该平台的AI识别每位说话者,转录并翻译对话,然后生成西班牙语和日语的新音轨。生成的声音保留了原始说话者的特质,为新观众创造了真实的观看体验。

要为文件创建配音,请按照以下步骤操作:

  1. 在文件名旁边,从下拉菜单中选择工作流的下一部分。在翻译之后,选择配音

  2. 点击添加配音。配音只能添加到已经翻译的语言。

  3. 从下拉列表中选择所需的翻译语言。

    注释

    如果选择了区域语言变体(例如,法语(加拿大)或葡萄牙语(巴西)),系统会自动回退到相应的基础语言进行配音。

    区域语言选择仍然保留在项目和元数据中。

  4. 可选,启用应用发音规则以提高文本到语音的准确性以选择现有的发音及相关配对用于配音工作流。

  5. 可选,上传字幕文件以继续进行配音步骤。(支持SRT/VTT)。

  6. 点击 开始配音

    窗口关闭,配音 选项卡指示配音何时完成。

点击 重新配音 以重新为所选语言进行配音。

点击 更新配音 以更新文本所做的任何更改。

点击 管理声音 以选择不同的配音声音。对于每种语言,系统会根据性别和年龄匹配自动建议最多 7 种推荐声音。

自定义声音仅支持 ElevenLabs 配音服务商。要使用自定义声音,请在项目设置(对于现有项目)或常规设置(对于新项目)中选择 ElevenLabs 作为配音服务商。

音频和配音控制

音频控制通过标记关键的声音细微差别来帮助使配音更具表现力和准确性,从而添加副语言信息。右键单击一个句段以在所需位置 添加音频控制,选择一个或多个可用选项。

注释

音频控制可能不适用于所有语言或声音模型。建议使用所选声音进行测试以确认兼容性。

测试后进行的音频调整或重新配音不会消耗 额外分钟

当一个项目包含多个发言者时,可以为每个发言者轨道和 配音 选项卡中的单独句段调整配音设置。

  • 发言者轨道控制

    • 音量

      点击波形中所需发言者名称旁边的音量图标 volume.jpeg 以调整音量滑块。该调整适用于该发言者所说的所有句段。

  • 句段控制

    • 音量

    • 稳定性

      控制生成的声音在一致性和可预测性方面的表现。

    • 相似性

      控制生成的声音与所选声音个人资料的匹配程度。

    在时间轴中选择一个句段以打开句段设置面板,并根据需要调整配音设置。点击立即保存,位于配音选项卡的右上角以保存更改。

    调整稳定性相似性后需要重新配音。点击应用更改以应用更新的设置。

调整配音速度

默认情况下,配音以1×速度生成,这意味着系统根据句段中的文本量确定最自然的说话节奏。

当前速度显示为时间轴中每个语音气泡上的标签。

如果需要,有两种方法可以调整配音速度:

  1. 在波形上延长或缩短语音气泡:

    示例

    如果配音音频在1×速度下超出预期场景,请拖动语音气泡的结束时间。配音会稍微加快以适应句段,速度标签也会相应更新。

  2. 编辑文本并重新配音:

    示例

    如果音频在1×速度下显著溢出,句段可能包含过多文本。重写文本并配音更改。

发音

发音控制特定单词或短语在配音音频中的发音方式。它们确保品牌名称、技术术语、缩略词和外语的发音一致。

可以定义自定义发音对,并在项目创建期间将其应用于配音工作流程。

对于现有项目,在编辑器的配音选项卡中添加新配音语言时,也可以选择发音。

发音会以只读模式自动与同一公司的所有用户共享。

前提条件

  • 该项目的目标语言支持配音。

  • 已将配音语言添加到项目中。

要创建发音,请按照以下步骤操作:

  1. 设置页面中,选择发音选项卡。

  2. 点击创建新发音

    将显示创建发音窗口。

  3. 输入发音名称和可选的描述

  4. 选择可用的以使发音可用于项目选择。

  5. 点击保存

    发音会列在发音选项卡中。

每个发音可以包含一个语言的多个对。要添加发音对,请按照以下步骤操作:

  1. 选择一个现有的发音,然后点击创建新对

  2. 提供原始源语单词或短语。

  3. 目标字段中定义所需的发音。

    使用音标拼写、音节分隔或近似音。

  4. 选择相关语言。

  5. 可选地,点击预览以收听并根据需要进行调整。

  6. 点击保存

    新对将添加到所选的发音中。

可以通过选择发音或对旁边的编辑来更新或删除现有的发音和相关对。

在更新发音对后重新运行配音;之前渲染的音频不会自动更改。

发音示例

  • 品牌名称

    • 苹果:ap-pul

    • 微软:mai-kroh-soft

  • 技术术语

    • GIF:jif

    • SQL:ess-cue-el

  • 外来词

    • 可颂:krwa-san

    • 圣保罗:sow-pow-loo

语音克隆

语音克隆基于真实说话者的录音生成合成语音。然后可以在AI配音中使用克隆的声音,使翻译的音频保留原说话者的语调和声音特征。

克隆过程使用从上传的音频或视频样本中选择的语音范围来训练语音模型。样本处理后,可以生成预览,然后保存语音。

语音克隆在我的声音选项卡的设置页面中创建和管理。一旦创建,语音便可用于配音工作流程。

语音样本要求

  • 总选择范围持续时间必须在15到180秒之间。

  • 最大上传文件持续时间:5分钟。

  • 最大样本文件:3个。

  • 最大文件大小:每个文件30 MB。

  • 最大样本范围:50个。

  • 如果语音样本包含多个说话者,范围必须用于隔离单个说话者的样本。

要创建语音克隆,请按照以下步骤操作:

  1. 我的声音选项卡的设置页面中,点击创建新语音

    显示创建您的语音部分。

  2. 上传样本以生成语音克隆。

    上传的媒体在波形播放器中显示,可以标记范围。

  3. 使用时间轴定义包含说话者声音的范围,然后点击完成

    所选范围已确认。可以通过点击添加范围以相同方式上传和处理其他文件。

    注释

    仅使用所选范围生成语音克隆。

  4. 选择同意复选框并确认

  5. 单击下一个

    语音详细信息步骤已显示。

  6. 输入语音名称。可选地,提供语音描述性别标签以进行分类。

  7. 单击下一个

    预览步骤已显示。第一个预览会自动生成。

  8. 选择预览语言并提供预览文本

  9. 单击预览语音

    音频样本已生成。这通常需要几秒钟。

  10. 点击保存

    新语音已添加到我的语音列表中。

现有的语音克隆可以在我的语音选项卡中预览或删除。

这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.