Custom AI

Create a Dataset

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

번역 메모리 선택 지침

Phrase Custom AI는 번역 메모리(TMS)를 활용하여 특정 용어와 스타일에 맞게 사용자 지정 기계 번역(MT) 모델을 생성함으로써 일반 기계 번역과 비교하여 이 컨텐츠 유형의 번역 품질을 향상시키며 사후 편집 시간이 줄어듭니다.

사용자 지정 프로세스의 효율에 영향을 미칠 수 있는 가장 중요한 요인은 사용된 번역 메모리입니다. 다음은 이 목적으로 사용 데이터를 결정하는 데 도움말 될 일반 지침입니다.

  • Single 도메인:

    데이터세트가 단일 스타일 및 용어를 포함하는 컨텐츠 중점을 둡니다. 데이터세트에 도메인 혼합이 포함된 경우(예: 웹사이트의 법적 용어와 제품 설명 모두) 모델이 원하는 스타일을 알아내지 못할 수 있습니다.

  • 유일한 컨텐츠 유형:

    사용자 지정 MT 모델은 인터넷에서 수집된 많은 양의 공용 데이터를 통해 학습된 일반 모델을 기반으로 구축됩니다. 번역 메모리 일반 모델을 구축하는 데 사용되는 일반 데이터와 매우 유사한 데이터가 포함되어 있으면 사용자 지정 프로세스에서 많은 이점을 얻을 수 없습니다.

  • 데이터 품질:

    모델은 번역 메모리 모든 문장 쌍이 생성되기를 원하는 아웃풋 예입니다. 번역 메모리 양질이 좋으며, 이상적으로 Professional 인간 번역으로 생성되어야 합니다. 데이터 정리 파이프라인은 데이터세트에서 가장 해로운 부분을 필터 데 도움말 될 수 있습니다.

  • 계상 양:

    RoI 측면에서 효과적인 사용자 정의가 되려면 데이터세트가 MT 품질에 더 큰 영향을 미칠 데이터의 대부분을 대표해야 합니다. 예를 들어, MT 아웃풋 중 일부를 수동 번역자가 사후 편집하려면, RoI를 극대화하려면 데이터가 사후 편집될 컨텐츠 대한 대표적이어야 합니다.

사용자 사용자 지정 MT 엔진 훈련하기 위해 데이터세트를 생성 다음 단계를 수행하십시오.

  1. 데이터세트 페이지에서 사용자 지정 MT 엔진 훈련을 클릭합니다.

    데이터세트 세부 정보 페이지가 열립니다.

  2. 데이터세트의 이름을 제공합니다.

  3. 언어 선택기는 다양한 옵션을 허용합니다.

    1. 일반 언어 데이터세트 생성하려면 소스 및 대상 언어 및 로캘 선택에서 동일한 소스 및 대상 언어를 선택합니다.

    2. 로캘별 데이터세트 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택한 다음 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다.

      더 많은 데이터 소스를 활용하기 위한 여러 대상 로캘도 추가할 수 있습니다.

    3. 여러 소스 및 대상 로캘이 있는 데이터세트를 생성하려면 첫 번째 드롭다운 목록에서 소스 및 대상 언어를 선택하고 두 번째 드롭다운 목록에서 소스 및 대상 로캘을 지정합니다(복수의 대상 로캘을 추가할 수 있음). + 더 많은 로캘 쌍 추가를 클릭합니다.

    입문 데이터 창이 나타납니다.

  4. 번역 메모리 추가를 클릭합니다.

    번역 메모리 선택 페이지가 검색 기능 search.jpg로 열립니다.

  5. 데이터세트에 TM을 추가하려면 AddTM.jpg 아이콘을 클릭하십시오. TM이 선택된 열에 추가됩니다.

    여러 TMS 최대 200개로 추가할 수 있으며 데이터세트에는 이상적으로 10,000개 이상의 세그먼트를 포함해야 합니다.

    TM 이름을 클릭하면 번역 메모리 페이지에 선택 사항이 표시됩니다.

    RemoveTM.jpg 아이콘을 클릭하여 선택된 열에서 TM을 제거합니다.

  6. 저장을 클릭합니다.

    데이터세트 세부 정보 페이지가 열립니다.

  7. 표시된 세부 정보를 검토하고, 올바른 경우 진행을 클릭합니다.

    클리닝 필터 페이지가 열립니다.

  8. 필수 필터를 적용하고 생성을 클릭하십시오.

    데이터세트는 생성되고 생성된 대상 열에서 클리닝의 초기 상태와 훈련 MT의 상태와 함께 데이터세트 페이지의 목록에 추가됩니다.

일반적인 오류:

  • 400 Invalid Value

    데이터세트에서 지원되지 않는 언어를 선택할 때 이 Error 나타날 수 있습니다. Custom AI는 Phrase NextMT를 기반으로 하며 Phrase NextMT에서 사용할 수 있는 언어만 지원합니다.

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.