파일 가져오기 설정

.XML - Extensible Markup Language (TMS)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

XML 파일 형식은 번역을 위해 설계되지 않았으며 성공적인 가져오기를 위해 추가 설정이 필요합니다.

기본 설정은 별표(*)로 표시되며 모든 XML 요소를 번역을 위해 가져옵니다. 가져오기 옵션은 가져오기 동작을 변경하는 데 사용할 수 있습니다.

AI 서비스는 .XML 기반 파일의 형식 문제를 식별하는 데 매우 효과적일 수 있습니다.

파일 유형

  • .XML

가져오기 옵션

일반 가져오기 규칙

  • 요소

    선택된 요소(예: 이름, 제목, 단락)만 가져옵니다. 별표(*)는 모든 요소를 가져옵니다.

  • 속성

    선택된 속성(예: 이름, 제목, 단락)만 가져옵니다. 별표(*)는 모든 속성을 가져옵니다.

  • 번역할 인라인 요소

    인라인 요소 자동 식별 옵션이 선택되면, 번역 가능한 텍스트의 모든 요소가 번역 가능 인라인 요소로 가져옵니다.

  • 번역하지 않을 인라인 요소

    선택된 인라인 요소 이름, 제목, 단락은 태그로 변환되며 내용은 번역할 수 없습니다.

    중요 사항

    태그와 관련된 문제는 내보내기 오류의 일반적인 원인입니다 (예: 파일을 생성할 수 없음), 특히 스프레드시트 (MS Excel 기반) 및 .XML와 같은 파일 유형에 대해 그렇습니다. 파일을 내보내기 전에 품질 보증 검사를 실행하여 태그와 형식이 올바른지 항상 확인하십시오.

  • 인라인 요소를 자동으로 식별

    텍스트 노드의 이웃 요소는 자동으로 인라인 태그로 변환됩니다.

  • 요소(HTML로서 처리)

    선택된 요소 코드는 .HTML로 처리됩니다. .HTML 가져오기 설정은 공백 유지 또는 줄 바꿈 태그 (<br/>)가 새 세그먼트를 생성와 같은 설정을 사용할 수 있습니다.

    선택된 요소 값에 .HTML 마크업이 포함된 경우 이 옵션을 사용하십시오. 다른 방식으로 지정되지 않는 한 선택된 요소의 자식에게는 적용되지 않습니다.

  • 잠긴 요소

    선택된 요소는 잠김으로 가져옵니다.

  • 잠긴 속성

    선택된 속성은 잠김으로 가져옵니다.

  • ICU 메시지 구문 분석

    ICU 메시지는 태그로 자동 변환됩니다. ICU 메시지가 있는 파일은 인라인 요소를 포함할 수 없습니다.

  • XML 개체 가져오기

    DTD 선언의 XML 엔티티는 번역을 위해 가져옵니다.

  • XML 세그먼트

    세그먼트 분할이 원하지 않으면 선택 해제하십시오.

  • 주석 가져오기

    요소가 HTML로 처리된 요소 옵션으로 표시된 경우 주석은 가져오지 않습니다.

  • Phrase TMS 태그로 변환 

    지정된 텍스트를 태그로 변환하려면 정규식을 적용하십시오.

  • 문자 개체로 변환

    출력 파일에 문자 참조 목록(쉼표로 구분)을 입력하십시오.

    예:

    따옴표(")가 필요한 경우 &quot;로 표시되며, 문자 Σ는 &#x3A3;로 표시됩니다. &quot;,&#x3A3;를 사용하십시오. &<는 각각 &amp;&lt;로 항상 내보내집니다.

XML 설정 사용하여 XPath

XPath 쿼리 언어를 사용하면 복잡한 가져오기 규칙과 일반 가져오기 규칙에서는 사용할 수 없는 추가 기능을 생성할 수 있습니다.

XPath 표현식은 번역해야 할 텍스트/값을 정의해야 하며 실제 텍스트 노드는 정의하지 않아야 합니다.

사용하기 전에 XPath에 대한 친숙함이 권장됩니다.

컨텍스트 메모, 컨텍스트 키, 및 최대 대상 길이는 10,000개 이상의 XML 요소가 있는 파일에 대해 처리되지 않습니다.

  • 컨텍스트 키

    해당 경우 TM 컨텍스트를 구성합니다(101% 일치).

  • 컨텍스트 메모

    각 요소에 대한 요소 또는 컨텍스트 속성을 가져옵니다.

  • 최대 대상 길이

    요소 또는 각 요소의 최대 대상 길이를 가져오기. 각 세그먼트의 글자 수 제한은 편집기 내부의 컨텍스트 메모 창에 표시됩니다. 한도를 초과하는 글자 빨간색으로 강조 표시됩니다.

  • 공백 보존

    요소의 공백을 보존하려면 비워 두십시오. 모든 요소의 모든 공백을 보존하려면 xml:whitespace='preserve'. //*를 적용하거나 임의의 XPath 표현식을 사용하십시오.

XSLT 스타일시트가 있는 HTML 미리 보기

XSLT 언어(확장 가능한 스타일시트 언어 변환)는 .XML 문서를 .HTML 형식으로 변환하는 데 사용될 수 있으며 컨텍스트 미리 보기 목적으로 사용됩니다. 따라서 문서 메뉴의 미리 보기 번역를 통해 다운로드된 미리 보기 파일은 HTML 확장자를 갖습니다. 현재 Phrase는 XSLT 2.0을 지원합니다.

미리 보기를 위한 XSLT는 소스가 아닌 대상을 기반으로 해야 합니다.

스타일시트를 가져오려면 파일 선택을 클릭하십시오.

파일 가져온 후 스타일시트를 다운로드하려면 다운로드 XSLT을 클릭하십시오.

XML 파일의 CDATA

CDATA는 문자 데이터(Character Data)를 의미하며, 파서에 의해 처리되지 않지만 마크업으로 인식되는 텍스트 블록으로 정의됩니다. &lt;, &gt;, 및 &amp;와 같은 미리 정의된 엔티티는 입력이 필요하며 일반적으로 마크업에서 읽기 어렵습니다. 이러한 경우 CDATA 섹션을 사용할 수 있습니다.

CDATA에 .HTML이 포함된 경우, 해당 XML 요소는 요소(HTML로 처리됨) 아래에 나열되어야 합니다.

소스 파일에 CDATA가 포함되어 있고 세그먼트 XML이 사용되면 CDATA는 완료된 파일의 모든 세그먼트에 추가됩니다.

CDATA는 구두점이나 공백과 같은 세그먼트 구분의 명확한 표시가 있는 경우에만 세그먼트화됩니다.

소스:

<text><![CDATA[번역 가능 텍스트 A. 번역 가능 텍스트 B.]]></text>

대상:

<text><![CDATA[번역 가능 텍스트 A.]]><![CDATA[ ]]><![CDATA[번역 가능 텍스트 B.]]></text>

완료된 파일은 유효한 .XML이며 XML 뷰어는 텍스트를 번역 가능 텍스트 A. 번역 가능 텍스트 B로 올바르게 표시합니다.

응용 프로그램 특정 설정

Wordpress XML

Wordpress XML에 대한 권장 설정:

  • XML

    XPath

  • 요소 및 속성

    //*[local-name()='encoded']|//description|//title

  • 요소(HTML로서 처리)

    //*[local-name()='encoded']|//description|//title

  • Phrase 태그로 변환

    (\[[^\]]++\])++

HTML 설정에서 공백 유지를 선택합니다.

다국어 XML

다국어 파일은 가져오기 전에 언어가 매핑된 여러 이중 언어 작업으로 가져옵니다. 그들은 multilingual_xml.png작업 테이블에 표시됩니다. 여러 대상 언어로 가져온 경우, 완료 파일은 모든 대상 언어로 구성됩니다.

구문은 대상이 비어 있더라도 모든 단락에 대해 소스 및 대상 요소가 모두 있는 XML 파일을 지원합니다. 소스와 대상 세그먼트가 다를 때, 소스 세그먼트가 결정적이다.

개별 언어 요소는 모두 동일한 trans-unit 요소의 자손이어야 하며, 하나의 언어가 다른 언어를 포함할 수 없다. 소스 및 대상 콘텐츠는 속성 값에 저장할 수 없다. trans-unit 요소 내에서 소스 또는 대상에 대한 XPath와 일치하는 여러 요소가 있는 경우, 번역을 위해 첫 번째 요소만 가져온다.

  • 작업을 생성할 때, 가져오기 옵션을 적용하기 전에 다국어 XML파일 형식 창에서 선택한다. 지정되지 않은 경우, 파일은 표준 .XML로 가져온다.

  • 소스 .XML 파일의 태그 콘텐츠는 태그 확장을 클릭하여 편집기에서 시각화할 수 있으며, 도구 메뉴 아래에서 클릭하여 F2로 편집할 수 있다.

예:

영어에서 독일어 및 프랑스어로 부분적으로 번역된 텍스트의 샘플. 모든 <tuv lang="en">, <tuv lang="de"><tuv lang="fr">는 동일한 <tu> 요소의 자식이다.

<?xml version="1.0" encoding="utf-8"?>
<root>
번역할 수 없는 텍스트.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>첫 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg>첫 번째 세그먼트</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="다른 컨텍스트 메모" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>두 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

가져오기 옵션

다국어 .XML 파일의 가져오기를 위해 XPath 쿼리 언어를 사용해야 한다. 참조를 위해 위의 예를 참조하십시오. XPath 표현식은 텍스트/값이 번역되어야 하는 요소를 정의하며 실제 텍스트 노드는 정의하지 않는다.

  • 소스 및 대상 하위 요소를 포함하는 요소

    //tu

  • 소스 텍스트를 포함하는 요소

    tuv[@lang='en']/seg (상위 요소 //tu와 관련하여)

  • 대상 텍스트를 포함하는 요소

    tuv[@lang='de']/seg (상위 요소 컨텍스트 메모와 관련하여 //tu)

  • 대상 텍스트를 포함하는 요소

    tuv[@lang='fr']/seg (상위 요소 //tu와 관련하여)

  • 번역하지 않을 인라인 요소

    소스 또는 대상의 모든 요소는 여기에서 번역하지 않을 부분으로 지정되지 않는 한 번역 가능 인라인 요소로 간주됩니다.

  • Phrase TMS 태그로 변환 

    지정된 텍스트를 태그로 변환하려면 정규식을 적용하십시오.

  • 컨텍스트 키

    세그먼트와 함께 저장되고 일치 컨텍스트에 사용되는 컨텍스트 키를 지정하십시오. 번역 메모리

  • 컨텍스트 메모

    각 요소에 대한 요소 또는 컨텍스트 속성을 가져옵니다.

  • 최대 대상 길이

    요소를 가져오거나 각 요소에 대한 최대 대상 길이를 설정하십시오.

  • 문자 개체로 변환

    출력 파일에 문자 참조 목록(쉼표로 구분)을 입력하십시오.

    예:

    따옴표(")가 필요한 경우 &quot;로 표시되며, 문자 Σ는 &#x3A3;로 표시됩니다. &quot;,&#x3A3;를 사용하십시오. &<는 각각 &amp;&lt;로 항상 내보내집니다.

  • ICU 메시지 구문 분석

    ICU 메시지는 태그로 자동 변환됩니다. ICU 메시지가 있는 파일은 인라인 요소를 포함할 수 없습니다.

  • HTML 하위 필터 사용 

    파일에 포함된 HTML 태그를 가져옵니다. 태그는 HTML 파일 가져오기 설정과 함께 사용할 수 있습니다. 단락 태그 <p>세그먼트 다국어 XML가 선택되지 않은 경우에도 새로운 세그먼트를 생성합니다.

  • 세그먼트 다국어 XML

    텍스트는 셀당 하나의 세그먼트가 아닌 일반 세그먼트 분할 규칙에 의해 세그먼트화됩니다.

    주의

    대상 텍스트가 포함된 파일에 세그먼트 다국어 XML을 적용하면 소스의 세그먼트 수가 대상과 다를 수 있습니다.

  • 비어 있지 않은 대상의 세그먼트 상태 설정 

    기본 확인 상태를 선택하고 확인된 세그먼트가 TM에 자동으로 추가되는지 여부를 선택하십시오.

:

다국어 .XML에 네임스페이스가 포함된 경우 XPath는 다음과 같을 수 있습니다:

  • 소스 및 대상 하위 요소를 포함하는 요소

    //*[local-name()='trans-unit']

  • 소스 텍스트를 포함하는 요소

    *[local-name()='source']

  • 대상 텍스트를 포함하는 요소

    *[local-name()='target']

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.