파일 가져오기 설정

.XML - TMS(Extensible Markup Language)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

.XML 파일 형식은 번역용으로 설계되지 않았으며 가져오기에 성공하려면 추가 설정이 필요합니다.

기본 설정은 별표(*)로 표시되며 번역을 위해 모든 XML 요소를 가져옵니다. 가져오기 옵션을 사용하여 가져오기 동작을 변경할 수 있습니다.

파일 형식

  • .XML

임포트 옵션(Import Options)

일반 가져오기 규칙

XPath를 사용한 XML 설정

XPath 쿼리 언어를 사용하면 복잡한 가져오기 규칙과 일반 가져오기 규칙에서 사용할 수 없는 몇 가지 추가 기능을 만들 수 있습니다.

XPath 표현식은 실제 텍스트 노드가 아닌 텍스트/값을 변환해야 하는 요소 및/또는 특성을 정의해야 합니다.

사용하기 전에 XPath에 대해 잘 알고 있는 것이 좋습니다.

컨텍스트 메모, 컨텍스트 키, 및 최대 대상 길이는 10,000개 이상의 XML 요소가 있는 파일에 대해 처리되지 않습니다.

  • 컨텍스트 키

    해당되는 경우 TM 컨텍스트(101% 일치)를 구성합니다.

  • 컨텍스트 메모

    각 요소에 대한 요소 또는 context 특성을 가져옵니다.

  • 최대 대상 길이

    요소 또는 각 요소의 최대 대상 길이를 가져옵니다. 각 세그먼트의 문자 제한은 편집기 내의 컨텍스트 메모창에 표시됩니다. 제한을 초과하는 모든 문자는 빨간색으로 강조 표시됩니다.

  • 공백 유지

    요소의 공백을 유지하려면 비워 둡니다. xml:whitespace='preserve'를 적용합니다. //* 를 사용하여 모든 요소의 모든 공백을 유지하거나 임의의 XPath 표현식을 사용합니다.

XSLT 스타일시트가 있는 HTML 미리보기

XSLT 언어(Extensible Stylesheet Language Transformations)를 사용하여 컨텍스트 내 미리 보기를 위해 .XML 문서를 .HTML 형식으로 변환할 수 있습니다. 따라서 문서 메뉴의 번역 미리보기를 통해 다운로드한 미리보기 파일은 HTML 확장자를 사용합니다. Phrase는 현재 XSLT 2.0을 지원합니다.

파일 선택을 클릭하여 스타일시트를 가져옵니다.

XSLT 다운로드를 클릭하여 파일 가져오기 후 스타일시트를 다운로드합니다.

XML 파일의 CDATA

CDATA는 문자 데이터를 의미하며 파서에 의해 처리되지 않지만 마크업으로 인식되는 텍스트 블록으로 정의됩니다. <,>, 및 & 와 같은 미리 정의된 엔터티는 입력이 필요하며 일반적으로 태그에서 읽기가 어렵습니다. 이러한 경우 CDATA 섹션을 사용할 수 있습니다.

CDATA에 포함된 .HTML 포함 경우 해당 XML 요소가 요소(HTML로 처리됨)아래에 나열되어야 합니다.

소스 파일에 CDATA가 포함되어 있고 세그먼트 XML 이 사용되는 경우 CDATA가 완료됨 파일의 모든 세그먼트에 추가됩니다.

CDATA는 문장 부호 또는 간격과 같은 세그먼트 나누기에 대한 명확한 표시가 있는 경우에만 세그먼트화됩니다.

근원:

<텍스트><! [CDATA[번역 가능한 텍스트 A. 번역 가능한 텍스트 B.]] ></텍스트>

과녁:

<텍스트><! [CDATA[번역 가능한 텍스트 A.]] ><! [CDATA[ ]]><! [CDATA[번역 가능한 텍스트 B.]] ></텍스트>

완성 파일은 유효한 .XML 파일이며 XML 뷰어는 텍스트를 번역 가능한 텍스트 A. 번역 가능한 텍스트 B올바르게 표시합니다.

응용 프로그램별 설정

Wordpress XML

Wordpress XML에 대한 권장 설정:

  • XML

    XPath

  • 요소 & 속성

    //*[local-name()='encoded']|//description|//title

  • 요소(HTML로 처리됨)

    //*[local-name()='encoded']|//description|//title

  • Convert to Phrase 태그

    (\[[^\]]++\])++

HTML 설정에서 공백 유지를 선택합니다.

다국어 XML

다국어 파일은 가져오기 전에 매핑된 언어와 함께 여러 이중 언어 작업으로 가져옵니다. 작업 테이블에서 multilingual_xml.png alt로alt 표시됩니다. 여러 대상 언어로 가져오는 경우 완료된 파일은 모든 대상 언어로 구성됩니다.

Phrase는 대상이 비어 있더라도 모든 단락에 대해 원본 및 대상 요소가 모두 있는 XML 파일을 지원합니다. 소스 세그멘테이션과 타겟 세그멘테이션이 다르면 소스 세그멘테이션이 결정됩니다.

개별 언어 요소는 모두 동일한 단위 간 요소의 하위 항목이어야 하며 한 언어가 다른 언어 내에 포함될 수 없습니다. 소스 및 대상 컨텐츠는 속성 값에 저장할 수 없습니다. 여러 요소가 trans-unit 요소 내의 source 또는 target에 대한 XPath와 일치하는 경우 변환을 위해 첫 번째 요소만 가져옵니다.

본보기:

영어에서 독일어 및 프랑스어로 부분적으로 번역된 텍스트의 샘플입니다. 모든 <tuv lang="en">, <tuv lang="de"> 및 <tuv lang="fr">은 동일한 <tu>, 요소의 자식입니다.

<?xml version="1.0" encoding="utf-8"?>
<root>
번역할 수 없는 텍스트입니다.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>첫 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste 세그먼트</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="다른 컨텍스트 참고" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>두 번째 세그먼트.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

임포트 옵션(Import Options)

다국어 .XML 파일을 가져오려면 XPath 쿼리 언어를 사용해야 합니다. 위의 예를 참조하십시오. XPath 표현식은 실제 텍스트 노드가 아닌 텍스트/값을 변환해야 하는 요소를 정의합니다.

  • 원본 및 대상 하위 요소를 포함하는 요소Elements containing source and target sub-elements

    //tu

  • 원본 텍스트를 포함하는 요소

    tuv[@lang='en']/seg (부모 요소 //tu와 관련하여)

  • 대상 텍스트를 포함하는 요소

    tuv[@lang='de']/seg (pa컨텍스트 노트 rent 요소 //tu와 관련)

  • 대상 텍스트를 포함하는 요소

    tuv[@lang='fr']/seg (부모 요소 //tu와 관련하여)

  • 번역할 수 없는 인라인 요소

    source 또는 target의 모든 요소는 여기에 번역할 수 없는 인라인 요소로 지정되지 않는 한 번역 가능한 인라인 요소로 간주됩니다.

  • 구문 TMS 태그로 변환 

    정규 표현식 을 적용 하여 지정된 텍스트를 태그로 변환합니다.

  • 컨텍스트 키

    세그먼트와 함께 번역 메모리 에 저장되고 컨텍스트 일치에 사용되는 컨텍스트 키를 지정합니다.

  • 컨텍스트 메모

    각 요소에 대한 요소 또는 context 특성을 가져옵니다.

  • 최대 대상 길이

    요소 가져오기 또는 각 요소의 최대 대상 길이

  • 문자 개체로 변환

    문자 참조 목록(쉼표로 구분)을 출력 파일에 입력합니다.

    본보기:

    따옴표(")가 필요한 경우 "로 표시되고 문자 Σ는 &#x3A3;로 표시되며 ", &#x3A3; 를 사용합니다 . & 및 <는 항상 각각 & 및 <로 내보내집니다.

  • ICU 메시지 구문 분석

    ICU 메시지는 자동으로 태그로 변환됩니다. ICU 메시지가 있는 파일에는 인라인 요소가 포함될 수 없습니다.

  • HTML 하위 필터 사용 

    파일에 포함된 HTML 태그를 가져옵니다. 그런 다음 태그를 HTML 파일 가져오기 설정과 함께 사용할 수 있습니다. 단락 태그 <p> 는 세그먼트 다국어 XML 을 선택하지 않은 경우에도 새 세그먼트를 만듭니다.

  • 다국어 XML 세그먼트

    텍스트는 셀당 하나의 세그먼트가 아닌 일반적인 세그먼트 규칙에 따라 세그먼트화됩니다.

    주의

    대상 텍스트가 포함된 파일에 세그먼트 다국어 XML 을 적용 하면 소스의 세그먼트 수가 대상과 다를 수 있습니다.

  • 비어 있지 않은 대상의 세그먼트 상태 설정 

    기본 확인 상태와 확인된 세그먼트를 TM에 자동으로 추가할지 여부를 선택합니다.

:

다국어 .XML 네임스페이스가 포함된 경우 XPath는 다음과 같을 수 있습니다.

  • 원본 및 대상 하위 요소를 포함하는 요소Elements containing source and target sub-elements

    //*[local-name()='trans-unit']

  • 원본 텍스트를 포함하는 요소

    *[local-name()='소스']

  • 대상 텍스트를 포함하는 요소

    *[local-name()='대상']

도움이 되었습니까?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.