.XML - Extensible Markup Language (TMS)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

XML 파일 형식은 번역을 위해 설계되지 않았으며 성공적인 가져오기를 위해 추가 설정이 필요합니다.

기본 설정은 별표(*)로 표시되며 모든 XML 요소를 번역을 위해 가져옵니다. 가져오기 옵션은 가져오기 동작을 변경하는 데 사용할 수 있습니다.

AI 서비스는 .XML 기반 파일의 형식 문제를 식별하는 데 매우 효과적일 수 있습니다.

파일 유형

.XML

가져오기 옵션

일반 가져오기 규칙

요소

선택된 요소(예: 이름, 제목, 단락)만 가져옵니다. 별표(*)는 모든 요소를 가져옵니다.
속성

선택된 속성(예: 이름, 제목, 단락)만 가져옵니다. 별표(*)는 모든 속성을 가져옵니다.
번역할 인라인 요소

인라인 요소 자동 식별 옵션이 선택되면 번역 가능한 텍스트의 모든 요소가 번역 가능 인라인 요소로 가져옵니다.
번역하지 않을 인라인 요소

선택된 인라인 요소 이름, 제목, 단락은 태그로 변환되며 내용은 번역할 수 없습니다.

중요 사항

태그(태그)와 관련된 문제는 내보내기 오류의 일반적인 원인입니다(예: 파일을 생성할 수 없음), 특히 스프레드시트 (MS Excel 기반) 및 .XML와 같은 파일 유형에 대해. 파일을 내보내기 전에 태그와 형식이 올바른지 항상 확인하고 품질 보증 검사를 실행하십시오.
인라인 요소를 자동으로 식별

텍스트 노드의 이웃 요소는 자동으로 인라인 태그로 변환됩니다.
요소(HTML로서 처리)

선택된 요소 코드는 .HTML로 처리됩니다. .HTML 가져오기 설정은 공백 유지 또는 줄 바꿈 태그 (<br/>)가 새 세그먼트를 생성와 같은 설정을 사용할 수 있습니다.

선택된 요소 값에 .HTML 마크업이 포함된 경우 이 옵션을 사용하십시오. 다른 방식으로 지정되지 않는 한 선택된 요소의 자식에게는 적용되지 않습니다.
잠긴 요소

선택된 요소는 잠김으로 가져옵니다.
잠긴 속성

선택된 속성은 잠김으로 가져옵니다.
문자 개체로 변환

출력 파일에 문자 참조 목록(쉼표로 구분)을 입력하십시오.

예:

따옴표(")가 필요한 경우, "로 표시되며, 문자 Σ는 Σ로 표시됩니다. ",Σ를 사용합니다. & 및 <는 각각 & 및 <로 내보내집니다.
Phrase TMS 태그로 변환

지정된 텍스트를 태그로 변환하려면 정규식을 적용하십시오.
ICU 메시지 구문 분석

ICU 메시지는 태그로 자동 변환됩니다. 세그먼트에 인라인 요소가 포함된 경우, 해당 세그먼트에 대한 ICU 구문 분석이 건너뜁니다. 인라인 요소가 없는 세그먼트는 정상적으로 구문 분석됩니다.
XML 개체 가져오기

DTD 선언의 XML 엔티티는 번역을 위해 가져옵니다.
사용자 지정 일반 개체 확장
주석 가져오기

요소가 HTML로 처리된 요소 옵션에 따라 HTML로 처리되는 경우 주석은 가져오지 않습니다.
세그먼트 분할에서 하위 요소 제외

XML 쌍 태그 또는 하위 요소 내에서 세그먼트 분할을 방지하려면 선택합니다. XML에 세그먼트 분할이 텍스트의 논리적 의미를 깨뜨릴 수 있는 중첩 구조가 포함된 경우 유용합니다.
XSLT 미리 보기 파일 생성

.XSL 스타일시트를 업로드하고 읽을 수 있는 미리 보기 파일을 생성할 수 있습니다.

XPath를 사용하는 XML 설정

XPath 쿼리 언어를 사용하면 복잡한 가져오기 규칙과 일반 가져오기 규칙에서는 사용할 수 없는 추가 기능을 생성할 수 있습니다.

XPath 표현식은 번역해야 할 텍스트/값을 정의해야 하며 실제 텍스트 노드는 정의하지 않아야 합니다.

사용하기 전에 XPath에 대한 친숙함이 권장됩니다.

컨텍스트 메모, 컨텍스트 키, 및 최대 대상 길이는 10,000개 이상의 XML 요소가 있는 파일에 대해 처리되지 않습니다.

컨텍스트 키

해당 경우 TM 컨텍스트를 구성합니다(101% 일치).
컨텍스트 메모

각 요소에 대한 요소 또는 컨텍스트 속성을 가져옵니다.
최대 대상 길이

요소 또는 각 요소의 최대 대상 길이를 가져오기. 각 세그먼트의 글자 수 제한은 편집기 내부의 컨텍스트 메모 창에 표시됩니다. 한도를 초과하는 글자 빨간색으로 강조 표시됩니다.
공백 보존

요소의 공백을 보존하려면 비워 두십시오. 모든 요소의 모든 공백을 보존하려면 xml:whitespace='preserve'. //*를 적용하거나 임의의 XPath 표현식을 사용합니다.
세그먼트 분할에서 제외된 노드

세그먼트화되지 않아야 하는 XML 요소 또는 속성을 지정합니다. 제외할 노드를 식별하는 XPath 표현식을 입력합니다. 이 노드에서 추출된 모든 텍스트는 더 작은 단위로 분할되지 않고 단일 세그먼트로 유지됩니다.

세그먼트화에서 속성 attr="value"를 포함하는 모든 <element> 노드를 제외하려면 //element[@attr='value']을 입력합니다.

HTML 미리 보기 및 XSLT 스타일시트

XSLT 언어(확장 가능 스타일시트 언어 변환)는 .XML 문서를 .HTML 형식으로 변환하는 데 사용될 수 있으며 문맥 내 미리 보기 목적을 위해 사용됩니다. 따라서 미리 보기 번역를 통해 다운로드된 미리 보기 파일은 문서 메뉴에서 HTML 확장자를 갖습니다. 현재 Phrase는 XSLT 2.0을 지원합니다.

미리 보기를 위한 XSLT는 소스가 아닌 대상을 기반으로 해야 합니다.

스타일시트를 가져오려면 파일 선택을 클릭하십시오.

파일 가져온 후 스타일시트를 다운로드하려면 다운로드 XSLT를 클릭하십시오.

XML 파일의 CDATA

CDATA는 문자 데이터(Character Data)를 의미하며, 파서에 의해 처리되지 않지만 마크업으로 인식되는 텍스트 블록으로 정의됩니다. <, > 및 &와 같은 미리 정의된 엔티티는 입력이 필요하며 일반적으로 마크업에서 읽기 어렵습니다. 이러한 경우 CDATA 섹션을 사용할 수 있습니다.

CDATA에 내장된 .HTML이 포함된 경우 해당 XML 요소는 요소(HTML로 처리됨) 아래에 나열되어야 합니다.

소스 파일에 CDATA가 포함되어 있고 세그먼트 XML이 사용되면 CDATA는 완료된 파일의 모든 세그먼트에 추가됩니다.

CDATA는 구두점이나 공백과 같은 세그먼트 구분의 명확한 표시가 있는 경우에만 세그먼트화됩니다.

소스:

<text><![CDATA[번역 가능 텍스트 A. 번역 가능 텍스트 B.]]></text>

대상:

<text><![CDATA[번역 가능 텍스트 A.]]><![CDATA[ ]]><![CDATA[번역 가능 텍스트 B.]]></text>

완료된 파일은 유효한 .XML이며 XML 뷰어는 텍스트를 번역 가능 텍스트 A. 번역 가능 텍스트 B로 올바르게 표시합니다.

응용 프로그램 특정 설정

워드프레스 XML

워드프레스 XML에 대한 권장 설정:

XML

XPath
요소 및 속성

//*[local-name()='encoded']|//description|//title
요소(HTML로서 처리)

//*[local-name()='encoded']|//description|//title
Phrase 태그로 변환

(\[[^\]]++\])++

HTML 설정에서 공백 유지을 선택하십시오.

다국어 XML

다국어 파일은 가져오기 전에 언어가 매핑된 여러 이중 언어 작업으로 가져옵니다. 그들은 로 작업 테이블에 표시됩니다. 여러 대상 언어로 가져오면 완료 파일은 모든 대상 언어로 구성됩니다.

구문은 대상이 비어 있더라도 모든 단락에 대해 소스 및 대상 요소가 모두 있는 XML 파일을 지원합니다. 소스 및 대상 세그먼트가 다를 경우 소스 세그먼트가 결정적입니다.

개별 언어 요소는 모두 동일한 trans-unit 요소의 자손이어야 하며, 하나의 언어가 다른 언어 내에 포함될 수 없습니다. 소스 및 대상 콘텐츠는 속성 값에 저장할 수 없습니다. trans-unit 요소 내에서 소스 또는 대상에 대한 XPath와 일치하는 여러 요소가 있는 경우, 번역을 위해 첫 번째 요소만 가져옵니다.

작업을 생성할 때, 가져오기 옵션을 적용하기 전에 파일 유형 창에서 다국어 XML을 선택하십시오. 지정되지 않은 경우, 파일은 표준 .XML로 가져옵니다.
소스 .XML 파일의 태그 콘텐츠는 도구 메뉴 아래의 태그 확장을 클릭하여 편집기에서 시각화할 수 있으며, F2를 클릭하여 편집할 수 있습니다.

예:

영어에서 독일어 및 프랑스어로 부분적으로 번역된 텍스트 샘플입니다. 모든 <tuv lang="en">, <tuv lang="de"> 및 <tuv lang="fr">는 동일한 <tu> 요소의 자식입니다.

<?xml version="1.0" encoding="utf-8"?>
<root>
번역할 수 없는 텍스트입니다.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>첫 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg>첫 번째 세그먼트</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>두 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

가져오기 옵션

다국어 .XML 파일을 가져오기 위해서는 XPath 쿼리 언어를 사용해야 합니다. 참조를 위해 위의 예를 참조하십시오. XPath 표현식은 텍스트/값이 번역되어야 하는 요소를 정의하며 실제 텍스트 노드는 정의하지 않습니다.

소스 및 대상 하위 요소를 포함하는 요소

//tu
소스 텍스트를 포함하는 요소

tuv[@lang='en']/seg (상위 요소 //tu와 관련하여)
번역하지 않을 인라인 요소

소스 또는 대상의 모든 요소는 여기에서 비번역 가능한 인라인 요소로 지정되지 않는 한 번역 가능한 인라인 요소로 간주됩니다.
컨텍스트 키

세그먼트와 함께 저장되는 컨텍스트 키를 지정하여 번역 메모리에 사용하여 일치하는 컨텍스트로 사용하십시오.
컨텍스트 메모

각 요소에 대한 요소 또는 컨텍스트 속성을 가져옵니다.
최대 대상 길이

요소 또는 각 요소의 최대 대상 길이를 가져옵니다.
문자 개체로 변환

출력 파일에 문자 참조 목록(쉼표로 구분)을 입력하십시오.

예:

따옴표(")가 필요한 경우, "로 표시되며, 문자 Σ는 Σ로 표시됩니다. ",Σ를 사용합니다. & 및 <는 각각 & 및 <로 내보내집니다.
Phrase TMS 태그로 변환

지정된 텍스트를 태그로 변환하려면 정규식을 적용하십시오.
ICU 메시지 구문 분석

ICU 메시지는 태그로 자동 변환됩니다. 세그먼트에 인라인 요소가 포함된 경우, 해당 세그먼트에 대한 ICU 구문 분석이 건너뜁니다. 인라인 요소가 없는 세그먼트는 정상적으로 구문 분석됩니다.
HTML 하위 필터 사용

파일에 포함된 HTML 태그를 가져옵니다. 그런 다음 HTML 파일 가져오기 설정에 태그를 사용할 수 있습니다. 단락 태그 <p>는 세그먼트 다국어 XML가 선택되지 않은 경우에도 새로운 세그먼트를 생성합니다.
HTML 하위 필터 사용

파일에 포함된 HTML 태그를 가져옵니다. 그런 다음 HTML 파일 가져오기 설정에 태그를 사용할 수 있습니다.
세그먼트 다국어 XML

텍스트는 셀당 하나의 세그먼트가 아닌 일반 세그먼트 분할 규칙에 의해 분할됩니다.

주의

대상 텍스트가 포함된 파일에 세그먼트 다국어 XML을 적용하면 소스의 세그먼트 수가 대상과 다를 수 있습니다.
비어 있지 않은 대상의 세그먼트 상태 설정

기본 확인 상태를 선택하고 확인된 세그먼트가 TM에 자동으로 추가되는지 여부를 선택하십시오.
XSLT 미리 보기 파일 생성

.XSL 스타일시트를 업로드하고 읽을 수 있는 미리 보기 파일을 생성할 수 있습니다.

예:

다국어 .XML에 네임스페이스가 포함된 경우 XPath는 다음과 같을 수 있습니다:

소스 및 대상 하위 요소를 포함하는 요소

//*[local-name()='trans-unit']
소스 텍스트를 포함하는 요소

*[local-name()='source']
대상 텍스트를 포함하는 요소

*[local-name()='target']

.XML - Extensible Markup Language (TMS)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

파일 유형

가져오기 옵션

중요 사항

HTML 미리 보기 및 XSLT 스타일시트

XML 파일의 CDATA

응용 프로그램 특정 설정

워드프레스 XML

다국어 XML

가져오기 옵션

주의