Datasets Page 文本由 Phrase Language AI 从英语机器翻译而得。 创建的数据集以表格的形式显示在数据集页面上。某些表格可以通过单击列标题来排序。单击数据集名称打开选择的概览。数据集可以从概览上的三个点菜单重命名或删除。 更多菜单还可用于打开概览、显示清理过滤器和清理历史记录、下载数据集或删除数据集。 如果清理失败并处于 Error 状态,请单击更多菜单中的重试,再次尝试。 数据集概述 概览提供了有关清理的信息,其中包含用于审查已应用筛选条件的选项卡和选定数据集的清理历史记录。清理过滤器的分布与所有元数据一起显示。 选项卡: Overview 显示该数据集的概览和清理筛选条件的分布。 正在清理筛选条件… 如果仅清理一次,显示为初始训练选择的筛选条件的结果。如果执行了更多清理,则显示上次清理的配置。 要更改筛选条件,请按照以下步骤操作: 在页面右侧,单击编辑过滤器。 编辑清理筛选条件页面打开。 点击编辑需要更改的筛选。 筛选选项打开。 进行所需的更改,然后单击保存。 将显示更改并激活重新清理按钮。 单击重新清理以更新清理。 正在清理历史… 下表列出了清洗情况。 评估数据集 仅当数据集用于机器翻译训练时才显示。为自定义定义 机器翻译 模型评估选择的句段数量由以下两个标准中的较低者决定: 总数据集的 10%。 固定计数 3000 个句段。 这些句段仅用于评估,不在模型训练阶段使用。