세그먼트 분할은 소스 텍스트를 더 작은 부분으로 나누는 것입니다. 이것은 번역 메모리에서 이전에 번역된 텍스트를 검색하는 것을 개선합니다. 세그먼트는 편집자에 표시되며 필터링할 수 있습니다. 프로젝트에 워크플로 단계가 있는 경우, 세그먼트의 변경 사항은 번역 변경 창에 표시됩니다.
기본 세그먼트 분할 규칙은 지원되는 각 언어의 세부 사항에 해당하며 사용자 정의할 수 있습니다.
잘못된 세그먼트 분할로 가져온 작업은 형식이 잘못된 문서 파일이나 부적절한 세그먼트 분할 사용자 정의의 적용과 같은 경우 TM 일치 값에 영향을 줄 수 있습니다.
예:
좋은 세그먼트 분할:
-
다국어 대상 언어를 가진 번역 메모리가 지원되며 양방향으로 사용할 수 있습니다.
100%의 일치 값.
불량 세그먼트 분할
-
다국어 대상 언어를 가진 번역 메모리가 지원됩니다.
100%의 일치 값.
-
그리고 양방향으로 사용할 수 있습니다.
63%의 일치 값.
사용자 정의된 세그먼트 분할 규칙은 작업 및 프로젝트 템플릿에 적용될 수 있습니다. 프로젝트에 사용자 정의된 세그먼트 분할 규칙이 필요한 경우, 해당 프로젝트를 위한 템플릿을 만들어야 합니다. 기본으로 설정되면, 사용자 정의된 세그먼트 분할 규칙이 해당 소스 언어에 대해 가져온 모든 새로운 작업에 적용됩니다.
세그먼트 분할 규칙에는 두 가지 유형이 있습니다:
-
약어를 .XLSX 파일로
-
.SRX 파일의 정규식
사용자 지정 규칙을 사용하려면 기본 규칙을 다운로드하고 수정한 후 수정된 파일을 업로드하고 지정된 작업에 적용하십시오.
주의
공백이 없는 CJK 소스 언어에 대한 사용자 지정 세그먼트 규칙을 추가할 때(대상 언어는 단어 구분 기호로 공백을 사용할 경우), 사용자 지정 규칙에 의해 분할된 대상 세그먼트에 선행 또는 후행 공백이 추가되도록 하십시오. 이는 번역에서 단어를 구분합니다. 기본 세그먼트 규칙에 의해 형성된 세그먼트에서는 자동으로 발생하지만, 수동으로 분할된 세그먼트나 추가 사용자 지정 세그먼트 규칙에 의해 형성된 세그먼트에서는 공백이 추가되지 않습니다.
기본 세그먼트 규칙을 다운로드하려면 다음 단계를 따르십시오:
-
설정
페이지에서 섹션으로 스크롤하여 세그먼트 분할을 클릭하십시오.
페이지가 열립니다.
-
사용자 지정할 언어를 선택하고 내보내기 XLSX/SRX을 클릭하십시오.
창이 열립니다.
-
형식 선택:
-
XLSX 약어 목록을 제공합니다.
-
SRX 정규식 규칙을 제공합니다.
-
-
드롭다운 목록에서 언어를 선택하십시오.
-
다운로드을 클릭하십시오.
파일이 시스템에 다운로드됩니다.
이전에 업로드한 세그먼트 규칙을 다운로드하려면 다음 단계를 따르십시오:
-
설정
페이지에서 섹션으로 스크롤하여 세그먼트 분할을 클릭하십시오.
페이지가 열립니다.
-
오른쪽의 설정 아이콘을 클릭하고 열 사용자 지정을 선택하십시오:
-
파일 이름 열을 활성화합니다.
-
파일 이름을 클릭하여 미리 저장된 규칙을 다운로드합니다.
약어는 개별 언어에 대해 지정할 수 있으며, 이후에는 새로운 세그먼트를 생성하지 않아야 합니다.
약어를 편집하려면 다음 단계를 따르십시오:
-
.XLSX 파일을 편집기에서 엽니다.
-
다음 형식으로 내용을 변경합니다:
.XLSX 파일은 제목 없이 두 개의 열이 있어야 합니다.
-
열 1: 지정할 약어
-
열 2: 세그먼트 분할 동작의 사양
-
ABBR_UPPER_NUM
약어 뒤에 공백이 오고 그 뒤에 숫자, 기호(수학, 통화 기호, 장식 문자 등) 또는 첫 글자가 대문자인 단어가 오면 새로운 세그먼트가 생성되지 않습니다.
-
ABBR_NUM
약어 뒤에 공백이 오고 그 뒤에 숫자가 오면 새로운 세그먼트가 생성되지 않습니다.
-
-
-
편집된 .XLSX 파일을 저장합니다.
.SRX 파일 편집은 정규 표현식 사용에 경험이 있는 사용자에게만 적합한 복잡한 과정입니다.
SRX 파일에서 변경할 수 있는 여러 규칙이 있습니다:
-
세그먼트 없이 XLSX 파일에서 텍스트를 가져옵니다; 하나의 셀은 하나의 세그먼트와 같습니다.
-
하나의 세그먼트를 두 개로 분할하기 위해 새 줄로 텍스트를 가져옵니다.
-
세그먼트 구분 기호로 콜론(또는 다른 문자)을 사용하십시오.
-
세그먼트 구분 기호로 세미콜론(또는 다른 문자)의 사용을 금지하십시오.
-
목록에서 약어를 제거합니다(텍스트가 세그먼트로 나뉩니다).
이 규칙은 글자 기반입니다; 세그먼트 구분 기호로는 단일 문자만 사용할 수 있습니다. 문자 그룹(예: <p>)은 세그먼트 구분 기호로 사용할 수 없습니다.
SRX 파일을 편집하려면 다음 단계를 따르십시오:
-
메모장 ++과 같은 텍스트 편집기에서 파일을 엽니다.
-
정규식을 사용하여 편집하거나 내부 세그먼트를 완전히 제거하십시오.
예:
-
<rule break="no">
세그먼트가 나뉘지 않는 규칙 목록입니다. 즉, 약어 목록입니다.
-
<rule> <beforebreak>
구분 기호 앞의 문자에 대한 정규식(예: 문장의 끝에서 ". ? ! :"). 예를 들어, 콜론 뒤의 세그먼트 텍스트를 원하지 않는 경우, 모든
<rule><beforebreak>
코드에서:
을 삭제하십시오. -
<rule> <afterbreak>
구분 기호 뒤의 문자에 대한 정규식(예: 새 문장의 시작; 공백 및 대문자).
-
-
수정된 SRX 파일을 저장하십시오.
수정된 또는 새로운 세그먼트 규칙을 업로드하려면 다음 단계를 따르십시오:
작업 가져오기에서 사용자 지정 규칙을 사용하거나 대상 세그먼트 길이를 구성하려면 다음 단계를 따르십시오:
-
작업 생성의 8단계에서 세그먼트 분할 및 세그먼트 길이를 에서 클릭합니다.
옵션 드롭다운이 열립니다.
-
드롭다운 목록에서 수정된 규칙을
에서 선택합니다. -
선택적으로 프로젝트 요구 사항(예: 자막 번역)에 따라 대상 세그먼트 길이에 대한 제한을 구성합니다:
-
를 선택하고 소스 세그먼트를 기준으로 세그먼트 길이를 제한할 선호 비율을 입력합니다.
-
를 선택하고 문자 수로 세그먼트 길이를 제한할 문자 수를 입력합니다.
-
-
생성을 클릭합니다.
작업이 생성되고 지정된 세그먼트 분할 규칙을 사용하여 목록에 추가됩니다.
SRX 파일에서 모든 내부 세그먼트 분할 규칙을 제거하고 전체 단락, 요소 또는 셀의 기본 세그먼트 분할만 적용합니다. 이 세그먼트 분할 규칙은 모든 파일 유형(MS Word, XML, HTML, Excel 등)에 적용될 수 있습니다.
예:
기본 세그먼트 분할로 가져온 이 XLSX 예제는 3개의 세그먼트를 가집니다: 피터!, 기다려!, 그리고 안녕하세요.
모든 내부 세그먼트 분할이 제거되고 셀을 기반으로 한 기본 세그먼트 분할만 남으면, 두 개의 세그먼트만 남습니다: 피터! 기다려! 그리고 안녕하세요.
SRX 파일을 편집하여 모든 기본 세그먼트 분할 규칙을 제거하십시오. 즉, <!-- break rules -->
와 </languagerule>
사이의 코드를 제거하십시오.
예:
계단식 분할로 인해 이 예제가 작동하지 않을 수 있습니다. 그런 경우, 편집된 SRX 파일을 Notepad++에서 열고 header
요소의 두 속성을 찾아 둘 다 no
로 변경하십시오.