세그먼트 분할은 소스 텍스트를 더 작은 부분으로 나누는 것입니다. 이것은 번역 메모리에서 이전에 번역된 텍스트를 검색하는 데 도움을 줍니다. 세그먼트는 편집자에 표시되며 필터링할 수 있습니다. 프로젝트에 워크플로 단계가 있는 경우, 세그먼트의 변경 사항은 번역 변경 창에 표시됩니다.
기본 세그먼트 규칙은 지원되는 각 언어의 세부 사항에 따라 다르며 사용자 정의할 수 있습니다.
잘못된 세그먼트로 가져온 작업은 형식이 잘못된 문서 파일이나 부적절한 세그먼트 사용자 정의의 적용과 같은 문제로 TM 일치 값에 영향을 줄 수 있습니다. 가져오기 전에 소스 파일을 검토하고 준비하는 데 시간을 할애하는 것이 좋습니다. 일반적인 문제는 줄 바꿈과 단락 바꿈의 잘못된 사용입니다.
사례:
좋은 세그먼트 분할:
-
다국어 대상 언어를 가진 번역 메모리가 지원되며 양방향으로 사용할 수 있습니다.
100%의 일치 값.
잘못된 세그먼트 분할
-
다국어 대상 언어를 가진 번역 메모리가 지원됩니다.
100%의 일치 값.
-
양방향으로 사용할 수 있습니다.
63%의 일치 값.
사용자 정의된 세그먼트 규칙은 작업 및 프로젝트 템플릿에 적용될 수 있습니다. 프로젝트에 사용자 정의된 세그먼트 규칙이 필요한 경우, 해당 프로젝트를 위한 템플릿을 만들어야 합니다. 기본으로 설정되면, 사용자 정의된 세그먼트 규칙이 해당 소스 언어에 대해 가져온 모든 새로운 작업에 적용됩니다.
세그먼트 규칙에는 두 가지 유형이 있습니다:
-
.XLSX 파일에 대한 약어
-
.SRX 파일의 정규식
사용자 지정 규칙을 사용하려면 기본 규칙을 다운로드하고 수정한 후 수정된 파일을 업로드하고 지정된 작업에 적용하십시오.
주의
공백이 없는 CJK 소스 언어에 대한 사용자 지정 세그먼트 규칙을 추가할 때(대상 언어는 단어 구분 기호로 공백을 사용할 경우), 사용자 지정 규칙에 의해 분할된 대상 세그먼트에 선행 또는 후행 공백이 추가되도록 하십시오. 이는 번역에서 단어를 구분합니다. 기본 세그먼트 규칙에 의해 형성된 세그먼트에서는 이 작업이 자동으로 발생하지만, 수동으로 분할된 세그먼트나 추가 사용자 지정 세그먼트 규칙에 의해 형성된 세그먼트에서는 공백이 추가되지 않습니다.
기본 세그먼트 규칙을 다운로드하려면 다음 단계를 따르십시오:
-
설정
페이지에서 섹션으로 스크롤하여 세그먼트를 클릭하십시오.
페이지가 열립니다.
-
사용자 지정할 언어를 선택하고 내보내기 XLSX/SRX를 클릭하십시오.
창이 열립니다.
-
형식 선택:
-
XLSX는 약어 목록을 제공합니다.
-
SRX는 정규식 규칙을 제공합니다.
-
-
드롭다운 목록에서 언어를 선택하십시오.
-
다운로드를 클릭하십시오.
파일이 시스템에 다운로드됩니다.
이전에 업로드한 세그먼트 규칙을 다운로드하려면 다음 단계를 따르십시오:
-
설정
페이지에서 섹션으로 스크롤하여 세그먼트를 클릭하십시오.
페이지가 열립니다.
-
오른쪽의 설정 아이콘을 클릭하고 열 사용자 지정을 선택하세요:
-
파일 이름 열을 활성화하세요
-
파일 이름을 클릭하여 미리 저장된 규칙을 다운로드하세요.
약어는 개별 언어에 대해 지정할 수 있으며, 이후에는 새로운 세그먼트를 생성하지 않아야 합니다.
약어를 편집하려면 다음 단계를 따르세요:
-
다운로드한 .XLSX 파일을 편집기로 엽니다.
-
다음 형식으로 내용을 변경하세요:
XLSX 파일은 제목이 없는 두 개의 열이 있어야 합니다.
-
열 1: 지정할 약어
-
열 2: 세그먼트 분할 동작의 지정
-
ABBR_UPPER_NUM
약어 뒤에 공백과 숫자, 기호(수학, 통화 기호, 장식 문자 등) 또는 첫 글자가 대문자인 단어가 오는 경우 새로운 세그먼트가 생성되지 않습니다.
-
ABBR_NUM
약어 뒤에 공백과 숫자가 오는 경우 새로운 세그먼트가 생성되지 않습니다.
-
-
-
편집된 .XLSX 파일을 저장하세요.
.SRX 파일 편집은 정규 표현식 사용에 경험이 있는 사용자에게만 적합한 복잡한 과정입니다.
SRX 파일에서 변경할 수 있는 여러 규칙이 있습니다:
-
XLSX 파일에서 세그먼트 없이 텍스트를 가져옵니다. 하나의 셀은 하나의 세그먼트와 같습니다.
-
하나의 세그먼트를 두 개로 분할하기 위해 새 줄로 텍스트를 가져옵니다.
-
세그먼트 구분 기호로 콜론(또는 다른 문자)을 사용합니다.
-
세그먼트 구분 기호로 세미콜론(또는 다른 문자)의 사용을 금지합니다.
-
목록에서 약어를 제거합니다(텍스트가 세그먼트로 나뉩니다).
이 규칙은 문자 기반입니다; 세그먼트 구분 기호로 단일 문자만 사용할 수 있습니다. 문자 그룹(예: <p>)은 세그먼트 구분 기호로 사용할 수 없습니다.
SRX 파일을 편집하려면 다음 단계를 따르십시오:
-
메모장 ++과 같은 텍스트 편집기에서 파일을 엽니다.
-
정규식을 사용하여 편집하거나 내부 세그먼트를 완전히 제거합니다.
예:
-
<rule break="no">세그먼트가 나뉘지 않는 규칙 목록입니다. 즉, 약어 목록입니다.
-
<rule> <beforebreak>단락 전의 문자에 대한 정규식(예: 문장의 끝에서 ". ? ! :"). 예를 들어, 콜론 뒤의 세그먼트 텍스트를 원하지 않는 경우, 모든
<규칙><단락 전>코드에서:을 간단히 삭제하십시오. -
<rule> <afterbreak>단락 후의 문자에 대한 정규식(예: 새 문장의 시작; 공백 및 대문자).
-
-
수정된 SRX 파일을 저장합니다.
수정된 또는 새로운 세그먼트 규칙을 업로드하려면 다음 단계를 따르십시오:
작업 가져오기에서 사용자 지정 규칙을 사용하거나 대상 세그먼트 길이를 구성하려면 다음 단계를 따르십시오:
-
작업 생성의 8단계에서 세그먼트 분할 및 세그먼트 길이를 에서 클릭하십시오.
옵션 드롭다운이 열립니다.
-
드롭다운 목록에서 수정된 규칙을 선택하십시오.
-
선택적으로, 프로젝트 요구 사항에 따라 대상 세그먼트 길이에 대한 제한을 구성하십시오 (예: 자막 번역):
-
을 선택하고 소스 세그먼트를 기준으로 세그먼트 길이를 제한할 선호하는 비율을 입력하십시오.
-
을 선택하고 문자 수로 세그먼트 길이를 제한할 문자 수를 입력하십시오.
-
-
생성을 클릭하십시오.
작업이 생성되고 지정된 세그먼트 분할 규칙을 사용하여 목록에 추가됩니다.
SRX 파일에서 모든 내부 세그먼트 분할 규칙을 제거하고 전체 단락, 요소 또는 셀의 기본 세그먼트 분할만 적용하십시오. 이 세그먼트 분할 규칙은 모든 파일 유형(MS Word, XML, HTML, Excel 등)에 적용될 수 있습니다.
예:
이 XLSX 예제는 기본 세그먼트 분할로 가져오면 3개의 세그먼트가 있습니다: 피터!, 기다려!, 그리고 안녕하세요.
모든 내부 세그먼트 분할이 제거되고 셀을 기반으로 한 기본 세그먼트 분할만 남으면, 두 개의 세그먼트만 있습니다: 피터! 기다려! 그리고 안녕하세요.
SRX 파일을 편집하여 모든 기본 세그먼트 분할 규칙을 제거하십시오. 즉, <!-- break rules -->와 </languagerule> 사이의 코드를 제거하십시오.
예:
계단식 분할로 인해 이 예제가 작동하지 않을 수 있습니다. 그런 경우, 편집된 SRX 파일을 Notepad++에서 열고 header 요소의 두 속성을 찾아 둘 다 no로 변경하십시오.