ファイルインポートの設定

.XML - 拡張マークアップ言語 (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

.XMLファイル形式は翻訳用に設計されていないため、インポートを成功させるには追加設定が必要です。

デフォルト設定ではアスタリスク(*)が付き、すべてのXML要素が翻訳対象としてインポートされます。インポートオプションは、インポート動作の変更に使用できます。

AIチャットボットは、.XMLベースのファイルのファイル形式の問題を特定するのに非常に効果的です。

ファイル形式

  • .XML

インポートオプション

プレーンインポートルール

  • タグ要素

    選択した要素(名前、タイトル、パラ)のみがインポートされます。アスタリスク(*)はすべての要素をインポートします。

  • タグ属性

    選択した属性(名前、タイトル、パラ)のみがインポートされます。アスタリスク(*)はすべての属性をインポートします。

  • 翻訳可能インライン要素

    [インライン要素自動識別] オプションを選択すると、翻訳可能テキスト内のすべての要素が翻訳可能インライン要素としてインポートされます。

  • 翻訳不要インライン要素

    選択されたインライン要素名、タイトル、paraはtagsに変換され、コンテンツは翻訳不可能になります。

  • インライン要素を自動的に判別する

    テキストノードの隣接要素は自動的にinline tagsに変換されます。

  • HTMLとして処理する要素

    選択した要素コードは.HTMLとして処理されます。空白を保持またはタグを破る<br/>などの.HTMLインポート設定は、これらの要素に使用できます。

    このオプションは、選択した要素値に.HTMLマークアップが含まれている場合に使用します。特に指定のない限り、選択した要素の子には適用されません。

  • ロック済要素

    選択した要素はロック済としてインポートされます。

  • ロック済属性

    選択した属性はロック済としてインポートされます。

  • ICUメッセージの解析

    ICUメッセージは自動的にtagsに変換されます。ICUメッセージを含むファイルには、インライン要素を含めることはできません。

  • XMLエンティティをインポート

    DTD宣言内のXMLエンティティは翻訳用にインポートされます。

  • セグメントXML

    セグメンテーションが不要な場合は選択を解除してください。

  • コメントをインポート

    要素(HTMLとして処理)」オプションで指定されているように要素がHTMLとして処理される場合、コメントはインポートされません。

  • Phrase TMSタグに変換する 

    正規表現を適用して、指定されたテキストをtagsに変換。

  • 文字実体へ変換

    出力ファイルに文字参照の一覧(コンマ区切り)を入力します。

    例:

    引用符(")が必要な場合は、&quot;、文字 Σ は &#x3A3; 使用 &quot;、&#x3A3; と表されます。&< は、それぞれ常に &amp;&lt; としてエクスポートされます。

XPathを使用したXML設定

XPath クエリ言語を使用すると、複雑なインポート規則の作成や、プレーンインポート規則では利用できない追加機能の一部を使用できます。

XPath式は、実際のテキストノードではなく、テキスト/値を翻訳する必要のある要素や属性を定義する必要があります。

使用する前に、XPath に精通していることをお勧めします。

コンテキストメモコンテキストキー訳文最大長は、XML 要素が 10,000 を超えるファイルは処理されません。

  • コンテキストキー

    TMコンテキスト(101%一致)を構成します(該当する場合)。

  • コンテキストメモ

    各要素のインポート要素またはコンテキスト属性。

  • 訳文の最大長さ

    要素をインポートするか、各要素の最大訳文文長を指定します。各セグメントの文字数制限は、エディタ内のコンテキストメモペインに表示されます。制限を超える文字は赤色で強調表示されます。

  • 空白箇所を維持する

    要素内の空白を保持するには、empty のままにします。xml:whitespace='preserve'. //* を適用して、すべての要素のすべての空白を保持するか、任意の XPath 表現を使用します。

XSLTスタイルシートを使用したHTMLプレビュー

XSLT言語(Extensible Stylesheet Language Transformations)を使用すると、文書内プレビュー目的で.XMLドキュメントを.HTML形式に変換できます。そのため、ドキュメントメニューのプレビュー翻訳でダウンロードされるプレビューファイルにはHTML拡張子が付いています。phraseは現在XSLT 2.0をサポートしています。

ファイルを選択をクリックしてスタイルシートをインポートします。

ダウンロード XSLT をクリックして、ファイルインポート後にスタイルシートをダウンロードします。

XMLファイルのCDATA

CDATAは文字データを意味し、パーサーによって処理されないがマークアップとして認識されるテキストのブロックとして定義されます。&lt;、&gt;&amp; などの定義済みの実体は入力が必要で、マークアップでは一般的に読みにくくなります。このような場合は、CDATAセクションを使用できます。

CDATAに.HTMLが埋め込まれている場合、対応するXML要素は要素(HTMLとして処理)の下にリストされます。

原文ファイルにCDATAが含まれており、セグメントXMLが使用されている場合、CDATAはCompletedファイルの各セグメントに追加されます。

CDATAは、句読点や間隔などセグメントの区切りがクリアに示されている場合にのみセグメント化されます。

原文:

<text><![CDATA[翻訳可能テキストA.翻訳可能テキストB.]]></text>

訳文:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

完成したファイルは有効な.XMLであり、XMLビューアはテキストを翻訳可能テキストA.翻訳可能テキストBとして正しく表示します。

アプリケーション固有設定

Wordpress XML

WordPress XMLの推奨設定:

  • XML

    XPath

  • 要素と属性

    //*[local-name()='encoded']|//description|//title

  • HTMLとして処理する要素

    //*[local-name()='encoded']|//description|//title

  • Phrase tagsに変換

    (\[[^\]]++\])++

HTML 設定で Preserve whitespaces を選択。

多言語XML

多言語ファイルは、インポート前に言語がマップされた複数のバイリンガルジョブとしてインポートされます。ジョブテーブルではmultilingual_xml.pngで表されます。複数の訳文言語にインポートされた場合、完了ファイルはすべての訳文言語で構成されます。

phraseは、訳文がemptyの場合でも、原文と訳文の両方の要素がすべての段落に存在するXMLファイルをサポートしています。原文と訳文のセグメンテーションが異なる場合、原文セグメンテーションが決定します。

個々の言語要素はすべて同じトランスユニット要素の子孫である必要があり、一方の言語を他方の言語に含めることはできません。原文と訳文のコンテンツは属性値に格納できません。複数の要素がトランスユニット要素内の原文または訳文の XPath と一致する場合、最初の 1 つだけが翻訳用にインポートされます。

  • ジョブを作成するときは、インポート オプションを適用する前に、[ファイルの種類] ペインから多言語 XML を選択します。指定しない場合、ファイルは標準の.XMLとしてインポートされます。

  • 原文 .XML ファイルのタグコンテンツは、ツールメニューの Expand tags をクリックしてエディタで可視化し、F2 をクリックして編集できます。

例:

英語からドイツ語、フランス語に部分的に翻訳されたテキストのサンプル。すべての <tuv lang="en"><tuv lang="de">、および <tuv lang="fr"> は同じ <tu> 要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳可能テキストではありません。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>最初のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste セグメント</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="別コンテキストメモ" キー="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>第2セグメント</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポートオプション

多言語 .XML ファイルのインポートには、XPath クエリ言語を使用する必要があります。参考資料として上記の例を参照してください。XPath式は、実際のテキストノードではなく、テキスト/値を翻訳する要素を定義します。

  • 原文と訳文のサブ要素を含む要素

    //tu

  • 原文テキストを含む要素

    tuv[@lang='en']/seg (親要素 //tu に対する)

  • 訳文テキストを含む要素

    tuv[@lang='de']/seg (paコンテキストメモの rent 要素 //tu と関連)

  • 訳文テキストを含む要素

    tuv[@lang='fr']/seg (親要素 //tu に対する)

  • 翻訳不要インライン要素

    ここで翻訳翻訳不要箇所インライン要素とみなされます

  • Phrase TMSタグに変換する 

    正規表現を適用して、指定されたテキストをtagsに変換。

  • コンテキストキー

    セグメントとともに翻訳メモリに保存し、一致コンテキストに使用するコンテキストキーを指定します。

  • コンテキストメモ

    各要素のインポート要素またはコンテキスト属性。

  • 訳文の最大長さ

    要素をインポートするか、各要素の最大訳文文長

  • 文字実体へ変換

    出力ファイルに文字参照の一覧(コンマ区切り)を入力します。

    例:

    引用符(")が必要な場合は、&quot;、文字 Σ は &#x3A3; 使用 &quot;、&#x3A3; と表されます。&< は、それぞれ常に &amp;&lt; としてエクスポートされます。

  • ICUメッセージの解析

    ICUメッセージは自動的にtagsに変換されます。ICUメッセージを含むファイルには、インライン要素を含めることはできません。

  • HTMLサブフィルターを使用する 

    ファイルに含まれるHTML tagsをインポートします。tagsはHTMLファイルインポート設定で使用できます。セグメント多言語XMLが選択されていなくても、paragraph tags <p>は新しいセグメントを作成します。

  • セグメント多言語XML

    テキストは、セルごとに1つのセグメントではなく、一般的なセグメンテーションルールによってセグメント化されます。

    注意

    訳文テキストを含むファイルにセグメント多言語XMLを適用すると、原文と訳文のセグメント数が異なる場合があります。

  • 空でないターゲットのセグメントステータスを設定する 

    デフォルトの確認ステータスと、確定済済セグメントを自動的にTMに追加するかどうかを選択します。

例:

多言語 .XML に名前空間が含まれる場合、XPath は次のようになります。

  • 原文と訳文のサブ要素を含む要素

    //*[local-name()='trans-unit']

  • 原文テキストを含む要素

    *[local-name()='source']

  • 訳文テキストを含む要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.