생성된 데이터셋은 페이지의 표에 표시됩니다. 일부 표는 열 제목을 클릭하여 정렬할 수 있습니다. 데이터셋 이름을 클릭하면 선택에 대한 가 열립니다. 데이터셋은 개요의 세 점 메뉴 에서 이름을 변경하거나 삭제할 수 있습니다.
메뉴 를 사용하여 를 열고, 클리닝 필터 및 클리닝 기록을 표시하며, 데이터셋을 다운로드하거나 삭제할 수 있습니다.
클리닝이 실패하고 오류 상태가 발생한 경우, 메뉴에서 를 클릭하여 다시 시도하십시오.
개요는 선택된 데이터셋의 클리닝에 대한 정보와 적용된 필터를 검토할 수 있는 탭 및 클리닝 기록을 제공합니다. 클리닝 필터의 분포는 모든 메타데이터와 함께 표시됩니다.
탭:
-
해당 데이터셋의 개요와 클리닝 필터의 분포를 표시합니다.
-
한 번만 클리닝된 경우, 초기 훈련을 위해 선택된 필터의 결과를 표시합니다. 더 많은 클리닝이 수행된 경우, 마지막 클리닝에 대한 구성이 표시됩니다.
필터를 변경하려면 다음 단계를 따르십시오:
-
청소 내역의 표가 제공됩니다.
평가 데이터셋
이것은 데이터셋의 목적이 MT 훈련인 경우에만 표시됩니다. 사용자 지정 MT 모델 평가를 위해 선택된 세그먼트 수는 다음 두 기준 중 더 작은 값에 의해 결정됩니다:
-
전체 데이터셋의 10%.
-
3,000 세그먼트의 고정 수.
이 세그먼트는 평가 전용이며 모델의 훈련 단계에서는 사용되지 않습니다.