번역 메모리 선택 지침
Phrase Custom AI는 번역 메모리(TMS)를 활용하여 특정 용어와 스타일에 맞게 사용자 지정 기계 번역(MT) 모델을 생성함으로써 일반 기계 번역과 비교하여 이 컨텐츠 유형의 번역 품질을 향상시키며 사후 편집 시간이 줄어듭니다.
사용자 지정 프로세스의 효율에 영향을 미칠 수 있는 가장 중요한 요인은 사용된 번역 메모리입니다. 다음은 이 목적으로 사용 데이터를 결정하는 데 도움말 될 일반 지침입니다.
-
Single 도메인:
데이터세트가 단일 스타일 및 용어를 포함하는 컨텐츠 중점을 둡니다. 데이터세트에 도메인 혼합이 포함된 경우(예: 웹사이트의 법적 용어와 제품 설명 모두) 모델이 원하는 스타일을 알아내지 못할 수 있습니다.
-
유일한 컨텐츠 유형:
사용자 지정 MT 모델은 인터넷에서 수집된 많은 양의 공용 데이터를 통해 학습된 일반 모델을 기반으로 구축됩니다. 번역 메모리 일반 모델을 구축하는 데 사용되는 일반 데이터와 매우 유사한 데이터가 포함되어 있으면 사용자 지정 프로세스에서 많은 이점을 얻을 수 없습니다.
-
데이터 품질:
모델은 번역 메모리 모든 문장 쌍이 생성되기를 원하는 아웃풋 예입니다. 번역 메모리 양질이 좋으며, 이상적으로 Professional 인간 번역으로 생성되어야 합니다. 데이터 정리 파이프라인은 데이터세트에서 가장 해로운 부분을 필터 데 도움말 될 수 있습니다.
-
계상 양:
RoI 측면에서 효과적인 사용자 정의가 되려면 데이터세트가 MT 품질에 더 큰 영향을 미칠 데이터의 대부분을 대표해야 합니다. 예를 들어, MT 아웃풋 중 일부를 수동 번역자가 사후 편집하려면, RoI를 극대화하려면 데이터가 사후 편집될 컨텐츠 대한 대표적이어야 합니다.
사용자 사용자 지정 MT 엔진 훈련하기 위해 데이터세트를 생성 다음 단계를 수행하십시오.
-
지정 MT 엔진 훈련을 클릭합니다.
페이지에서 사용자페이지가 열립니다.
-
데이터세트의 이름을 제공합니다.
-
언어 선택기는 다양한 옵션을 허용합니다.
-
일반 언어 데이터세트 생성하려면 소스 및 대상 언어 및 로캘 선택에서 동일한 소스 및 대상 언어를 선택합니다.
-
로캘별 데이터세트 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택한 다음 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다.
더 많은 데이터 소스를 활용하기 위한 여러 대상 로캘도 추가할 수 있습니다.
-
여러 소스 및 대상 로캘이 있는 데이터세트를 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택하고 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다(복수의 대상 로캘을 추가할 수 있음). + 더 많은 로캘 쌍 추가를 클릭합니다.
창이 나타납니다.
-
-
번역 메모리 추가를 클릭합니다.
페이지가 검색 기능로 열립니다.
-
데이터세트에 TM을 추가하려면
아이콘을 클릭하십시오. TM이 열에 추가됩니다.
여러 TMS 최대 200개로 추가할 수 있으며 데이터세트에는 이상적으로 10,000개 이상의 세그먼트를 포함해야 합니다.
TM 이름을 클릭하면 번역 메모리 페이지에 선택 사항이 표시됩니다.
아이콘을 클릭하여 열에서 TM을 제거합니다.
-
저장을 클릭합니다.
페이지가 열립니다.
-
표시된 세부 정보를 검토하고, 올바른 경우 진행을 클릭합니다.
페이지가 열립니다.
-
필수 필터를 적용하고 생성을 클릭하십시오.
데이터세트는 생성되고
열에서 의 초기 상태와 의 상태와 함께 페이지의 목록에 추가됩니다.
일반적인 오류:
-
400 Invalid Value
데이터세트에서 지원되지 않는 언어를 선택할 때 이 Error 나타날 수 있습니다. Custom AI는 Phrase NextMT를 기반으로 하며 Phrase NextMT에서 사용할 수 있는 언어만 지원합니다.