번역 메모리 선택 지침
Phrase Custom AI는 번역 메모리(TMS)를 활용하여 특정 용어와 스타일에 맞게 사용자 지정 기계 번역(MT) 모델을 생성함으로써 일반 기계 번역과 비교하여 이 컨텐츠 유형의 번역 품질을 향상시키며 사후 편집 시간이 줄어듭니다.
사용자 지정 프로세스의 효율에 영향을 미칠 수 있는 가장 중요한 요인은 사용된 번역 메모리입니다. 다음은 이 목적으로 사용 데이터를 결정하는 데 도움말 될 일반 지침입니다.
-
Single 도메인:
데이터세트가 단일 스타일 및 용어를 포함하는 컨텐츠 중점을 둡니다. 데이터세트에 도메인 혼합이 포함된 경우(예: 웹사이트의 법적 용어와 제품 설명 모두) 모델이 원하는 스타일을 알아내지 못할 수 있습니다.
-
유일한 컨텐츠 유형:
사용자 지정 MT 모델은 인터넷에서 수집된 많은 양의 공용 데이터를 통해 학습된 일반 모델을 기반으로 구축됩니다. 번역 메모리 일반 모델을 구축하는 데 사용되는 일반 데이터와 매우 유사한 데이터가 포함되어 있으면 사용자 지정 프로세스에서 많은 이점을 얻을 수 없습니다.
-
데이터 품질:
모델은 번역 메모리 모든 문장 쌍이 생성되기를 원하는 아웃풋 예입니다. 번역 메모리 양질이 좋으며, 이상적으로 Professional 인간 번역으로 생성되어야 합니다. 데이터 정리 파이프라인은 데이터세트에서 가장 해로운 부분을 필터 데 도움말 될 수 있습니다.
-
계상 양:
RoI 측면에서 효과적인 사용자 정의가 되려면 데이터세트가 MT 품질에 더 큰 영향을 미칠 데이터의 대부분을 대표해야 합니다. 예를 들어, MT 아웃풋 중 일부를 수동 번역자가 사후 편집하려면, RoI를 극대화하려면 데이터가 사후 편집될 컨텐츠 대한 대표적이어야 합니다.
자동 자산 큐레이션을 위한 데이터세트 생성에는 약간 다른 프로세스가 있습니다.
사용자 사용자 지정 MT 엔진 훈련하기 위해 데이터세트를 생성 다음 단계를 수행하십시오.
-
지정 MT 엔진 훈련을 클릭합니다.
페이지에서 사용자페이지가 열립니다.
-
데이터세트의 이름을 제공합니다.
-
언어 선택기는 다양한 옵션을 허용합니다.
-
일반 언어 데이터세트 생성하려면 소스 및 대상 언어 및 로캘 선택에서 동일한 소스 및 대상 언어를 선택합니다.
-
로캘별 데이터세트 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택한 다음 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다.
더 많은 데이터 소스를 활용하기 위한 여러 대상 로캘도 추가할 수 있습니다.
-
여러 소스 및 대상 로캘이 있는 데이터세트를 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택하고 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다(복수의 대상 로캘을 추가할 수 있음). + 더 많은 로캘 쌍 추가를 클릭합니다.
창이 나타납니다.
-
-
번역 메모리 추가를 클릭합니다.
페이지가 검색 기능로 열립니다.
-
데이터세트에 TM을 추가하려면
아이콘을 클릭하십시오. TM이 열에 추가됩니다.
여러 TMS 최대 200개의 TMS 최대 8백만 개의 세그먼트에 추가할 수 있습니다. 이상적으로 데이터세트에는 10,000개 이상의 세그먼트가 포함되어야 합니다.
TM 이름을 클릭하면 번역 메모리 페이지에 선택 사항이 표시됩니다.
아이콘을 클릭하여 열에서 TM을 제거합니다.
-
저장을 클릭합니다.
페이지가 열립니다.
-
표시된 세부 정보를 검토하고, 올바른 경우 진행을 클릭합니다.
페이지가 열립니다.
-
필수 필터를 적용하고 생성을 클릭하십시오.
데이터세트는 생성되고
열에서 의 초기 상태와 의 상태와 함께 페이지의 목록에 추가됩니다.