文件导入设置

电子表格 - 基于 MS Excel (TMS)

文本由 Phrase Language AI 从英语机器翻译而得。

仅包含数字和函数的单元格将被跳过,因为假定它们不包含与导入相关的数据。

默认情况下,电子表格文件中的所有工作表都会被导入,除非被隐藏。要控制是否导入隐藏内容,请选择 导入隐藏列、隐藏行和隐藏工作表 选项(多语言文件不可用)。通过 Phrase Portals 处理的作业具有相同的条件。

包含超过 10,000 个带条件格式的单元格的电子表格文档,并使用 多语言 Excel带 HTML 的 Excel(处理 HTML 代码)或 带转换为 Phrase TMS 标签的 Excel 过滤器处理,将被拒绝,原因是文件过大/复杂。

重要

标签 相关的问题是导出错误的常见原因(例如 文件无法生成),尤其是对于 电子表格(基于 MS Excel)和 .XML 等文件类型。在导出文件之前,通过运行 质量保证 检查,始终确保标签和格式正确。

使用上述设置(多语言 Excel、带 HTML 的 Excel 和带转换为 Phrase TMS 标签的 Excel 过滤器)处理的文件在导入时将转换为 XML。大多数格式、图表和图像将丢失。.XLSM 格式中的嵌入宏也将丢失。

AI 服务在识别 .XML 基于文件中的格式问题方面非常有效。

上下文预览 仅能为导入文件中的最多 200 列生成。超过 200 列的文件将显示警告 未生成上下文预览。此限制不适用于在原始文件中标记为 隐藏 的列。

提示

Microsoft Excel 文件预览以 SpreadsheetML (.XML) 格式下载,可以在任何兼容的电子表格编辑器中打开。如果安装了 MSOffice,通常会自动在 Excel 中打开;如果没有,请使用文件 右键菜单 中的 打开方式 操作选择应用程序。

文件类型

  • .XLSX

  • .XLTX

  • .XLSM

  • .XLTM

重要

2025年10月31日开始,Phrase TMS将不再支持导入或处理基于Microsoft Office的遗留文件格式:.xls,.xlt。

支持OpenOffice或LibreOffice文档(.ODT,.ODS或.ODP),但建议在导入之前将其保存为MS Office格式。

通过Google Drive连接器导入时,Google文档、表格和幻灯片会自动转换为.DOCX、.XLSX或.PPTX。

导入选项

  • 单元格读取顺序

  • 导入备注

  • 导入表名

  • 导入隐藏列、隐藏行和隐藏工作表

    默认情况下,不会导入隐藏内容。

  • 导入其他文本

    提取文件中通常不可翻译的特殊值/名称/属性。

  • 处理 HTML 代码

    在文件包含HTML标签的情况下(<b><span>等)

    • 禁用除转换为 Phrase TMS 标签以外的选项。

    • HTML导入设置不能用于编辑默认设置。

    • 应用单元格读取顺序“行,从左到右”。

  • 转换为 Phrase TMS 标签 

    应用正则表达式将指定文本转换为标签。

    禁用除处理 HTML 代码以外的选项。

  • 导入已选择的列

    输入以逗号分隔的列列表,例如 A,C,Q。

多语言电子表格文件

多语言文件作为多个双语工作导入,语言在导入前进行映射。它们在作业表中表示为 multilingual_xlsx.png。如果导入到多个目标语言中,已完成 文件由所有目标语言组成。

  • 隐藏的工作表不被处理。

  • 目标列中的合并单元格不被支持。

  • 日期和公式的显示单元格内容依赖于区域或基础值(例如:"布尔值" TRUE 或 FALSE)不会被暴露以供翻译,但会自动复制到目标列。提示:要暴露此类值,您需要在插入值之前将源 MS Excel 文件中的单元格格式设置为文本。

  • 仅包含数字的源或目标段落不会被导入进行翻译。

  • 由于软件包或这些软件包的版本,某些文件无法转换为多语言文件。

  • 共享的 .XLSX 文件(共享工作簿)无法作为多语言文件导入。

  • 创建 工作 时,如果文件的第一行包含标准 语言代码,并且文件类型设置为 自动检测,则会被自动检测为多语言并作为单独的工作导入。自动检测不适用于从存储库导入的工作。

  • 尽管 QA 不会返回标签和格式错误,但导出可能会因 文件无法生成 错误消息而失败。这可能是由于目标端标签顺序不同,通过添加 自定义 QA 检查 可以揭示这一点。

    字段中的条目在源和目标中是相同的。

    对于 标签顺序(未配对)

    ^.*\{1\}.*\{2\}.*$ 

    ^.*\{1\}.*\{2\}.*\{3\}.*$ 

    ^.*\{1\}.*\{2\}.*\{3\}.*\{4\}.*$ 

    对于 标签顺序(配对)

    ^.*\\{1\\>.*\\<1\\}.*\\{2\\>.*\\<2\\}.*$ 

    ^.*\\{1\\>.*\\<1\\}.*\\{2\\>.*\\<2\\}.*\\{3\\>.*\\<3\\}.*$ 

    ^.*\\{1\\>.*\\<1\\}.*\\{2\\>.*\\<2\\}.*\\{3\\>.*\\<3\\}.*\\{4\\>.*\\<4\\}$ 

  • 在多语言文件上使用 更新源 工具时,所有相关工作必须具有 新建已发邮件已接受 状态。

导入选项

注意

不支持逗号以外的分隔符,这将导致错误。

  • 使用 HTML 子过滤器 

    导入文件中包含的 HTML 标签。标签可与 HTML 文件导入设置 一起使用。段落标签 <p> 即使在未选择 切分多语言 XLS 的情况下也会创建新句段。使用 HTML 子过滤器时,其他选项将被禁用。

    注意

    启用 HTML 子过滤器时,Excel 中本地应用的行内文本格式(如粗体、斜体或下划线)不受支持,可能导致不必要的断句。这包括本地格式与 HTML 标签混合的文件,以及完全不包含 HTML 标签的文件。

  • 切分多语言 XLS 

    文本是通过一般的 断句规则 进行分段,而不是每个单元格一个句段。

    注意

    切分多语言 XLS 应用于包含目标文本的文件,可能导致源文本和目标文本中的句段数量不同。

  • 设置非空译文的句段状态 

    选择默认确认状态,以及是否将已确认的句段自动添加到翻译记忆库。

  • 识别源列 () 

    使用小写或大写字母。对于更多列,请输入用逗号分隔的字母,不要有空格 (A,D,G)。

  • 目标语 (列) 

    每种目标语言都有一列。对于更多列,请输入用逗号分隔的字母,不要有空格 (B,E,H)。

  • 只导入特定的行 

    输入要导入的行(1,4,7)。

  • 识别上下文键(列) 

    指定一个与句段一起保存到翻译记忆库的上下文键,并用于匹配上下文。

  • 识别上下文注释(列) 

    列设置为上下文注释B,C)。注释将显示在单独的行上。

  • 识别最大长度(列) 

    设置翻译的最大长度。仅支持整数。要添加更多列,请输入用逗号分隔的字母,不要有空格(I,J,K)。每个句段的字符限制显示在编辑器内的上下文注释窗口中。所有超出限制的字符都会被标红。

    如果一个单元格被拆分为多个句段,将分别检查每个句段的最大长度限制。

  • 转换为 Phrase TMS 标签 

    应用正则表达式将指定文本转换为标签。

示例: 

Spreadsheet job options
这篇文章有帮助吗?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.