Custom AI

필터 청소

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

Phrase Custom AI를 사용하면 AI 기반 및 규칙 기반 청소 필터를 사용하여 번역 메모리를 데이터 세트에 적용할 수 있습니다. 신규 사용자에게 적합할 수 있는 기본 설정이 제공됩니다.

모든 필터는 정리된 버전의 세그먼트에서 평가됩니다. 예를 들어 여러 공백이 하나로 줄어들고 Phrase 태그가 제거됩니다.

기간

종료 날짜와 시작 날짜는 모두 고려된 세그먼트의 마지막 수정 날짜에 포함됩니다.

소스와 타겟이 잘못 정렬되었습니다.

이 필터를 사용하면 세그먼트가 의미 및 의미론적 유사성 측면에서 얼마나 잘 일치하는지 확인하여 가장 낮은 등급의 세그먼트를 제거할 수 있습니다. 문장 쌍 정렬은 LASER 메트릭을 사용하여 측정됩니다 .

AI 엔진은 원본 텍스트와 대상 텍스트가 동일한 것을 의미하는지 또는 얼마나 같은 것을 의미하는지 확인하는 데 사용됩니다. 권장 설정은 10%의 최악 세그먼트를 삭제하고 90%의 최적 세그먼트를 유지합니다.

고급 설정을 사용하면 정렬을 변경할 수 있으며 0과 1 사이의 숫자(1은 완전한 정렬을 의미)를 사용하여 원시 유사성 점수를 기반으로 하는 필터가 될 수 있습니다. 원시 유사성 점수를 사용하는 경우 각 언어 쌍의 점수 분포가 다르고 한 언어 쌍에서 좋은 점수로 간주되는 점수가 다른 언어 쌍에서는 만족스럽지 않은 점수가 될 수 있으므로 주의하는 것이 좋습니다.

최소 문자 수

문자 수 에는 모든 문자가 포함됩니다. 여기에는 모든 문자, 공백, 구두점 및 기호가 포함됩니다.

문자 수는 영어 알파벳과 같은 문자만 계산하지만 발음 구별 부호 또는 한자가 있는 더 복잡한 문자도 계산합니다. 하나의 한자는 둘 이상의 문자를 나타내더라도 하나의 문자로 계산됩니다.

문장 쌍 길이

총 문자 수에는 원본 문장과 대상 문장 모두의 모든 문자(문자뿐만 아니라 공백, 구두점)가 포함됩니다. 언어 유형(예: 중국어 및 영어)을 고려해야 합니다. 소스 언어가 CJK와 유사하지 않고 대상 언어가 CJK 인 경우(또는 그 반대인 경우) 이 필터는 무시됩니다.

길이 비율

이 필터는 소스 세그먼트와 대상 세그먼트를 비교할 때 길이가 훨씬 더 긴 세그먼트를 식별합니다. 일부 번역은 원본에서 대상 언어로 번역할 때 길이가 늘어나거나 줄어듭니다. 번역이 너무 길거나 너무 짧으면 학습 데이터의 품질이 낮을 수 있습니다.

소스 언어가 CJK와 유사한 알파벳이 아니고 대상 언어가 CJK(또는 그 반대)인 경우 이 필터는 무시됩니다.

번역 불가

대상 텍스트가 원본 텍스트에서 변경되지 않은 상태로 남아 있는 번역할 수 없는 모든 문장 쌍을 제외합니다.

중복

동일한 소스 문장이 있는 세그먼트 그룹이 만들어집니다. 각 그룹에서 가장 좋은 세그먼트만 유지되므로 세그먼트의 원본 문장이 고유한 경우 자동으로 유지됩니다. 그렇지 않으면. 유사성 점수가 가장 높은 세그먼트가 유지됩니다.

거의 중복됨

거의 중복을 테스트 할 때 소스 문장의 (약간 더 깨끗한 버전)이 정규화됩니다. 문자가 아닌 모든 문자(몇 가지 예: ",?)! -)는 공백으로 대체되고 모든 문자는 소문자로 렌더링됩니다.

정규화된 소스 문장을 사용하면 동일한 정규화된 소스 문장을 가진 세그먼트 그룹이 생성됩니다. 각 그룹에서 가장 좋은 세그먼트만 유지되므로 세그먼트의 정규화된 소스 문장이 고유하고 자동으로 유지됩니다. 그렇지 않으면. 유사성 점수가 가장 높은 세그먼트가 유지됩니다.

언어 식별

AI 엔진은 문장을 기반으로 소스 및 대상 언어를 식별하는 데 사용됩니다. 세그먼트는 엔진이 (소스/대상) 언어를 인식하고(예를 들어, 짧은 문장은 엔진이 언어를 결정하기에 충분하지 않은 경우가 많음) 언어가 예상과 다른 경우에만 제거됩니다.

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.