ファイルインポートの設定

.XML - 拡張可能なマークアップ言語 (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

.XMLファイル形式は翻訳用に設計されておらず、成功したインポートには追加の設定が必要です。

デフォルト設定はアスタリスク(*)で示され、すべてのXML要素が翻訳のためにインポートされます。インポートオプションを使用してインポートの動作を変更できます。

AIサービスは.XMLベースのファイルの形式の問題を特定するのに非常に効果的です。

ファイル形式

  • .XML

インポートオプション

プレーンインポートルール

  • 要素

    選択された要素(例:名前、タイトル、段落)のみがインポートされます。アスタリスク(*)はすべての要素をインポートします。

  • 属性

    選択された属性(例:名前、タイトル、段落)のみがインポートされます。アスタリスク(*)はすべての属性をインポートします。

  • 翻訳可能なインライン要素

    インライン要素を自動的に識別するオプションが選択されている場合、翻訳可能なテキスト内のすべての要素は翻訳可能なインライン要素としてインポートされます。

  • 翻訳不要のインライン要素

    選択されたインライン要素名前、タイトル、段落はタグに変換され、コンテンツは翻訳できません。

    注意

    タグに関する問題は、エクスポートエラーの一般的な原因です(例:ファイルを生成できませんでした)、特にスプレッドシート(MS Excelベース)や.XMLのようなファイルタイプにおいて。ファイルをエクスポートする前に、品質管理チェックを実行して、タグとフォーマットが正しいことを常に確認してください。

  • インライン要素を自動的に特定する

    テキストノードの隣にある要素は、自動的にインラインタグに変換されます。

  • 要素(HTMLとして処理される)

    選択した要素コードは.HTMLとして処理されます。.HTMLインポート設定は、空白を保持する改行タグ(<br/>)が新しいセグメントを作成するなどがこれらの要素に使用できます。

    選択した要素の値に.HTMLマークアップが含まれている場合にこのオプションを使用します。特に指定されない限り、選択した要素の子には適用されません。

  • ロックされた要素

    選択した要素はロック済としてインポートされます。

  • ロックされた属性

    選択した属性はロック済としてインポートされます。

  • 文字実体へ変換

    出力ファイルに文字参照のリスト(カンマで区切る)を入力してください。

    例:

    引用符(")が必要な場合、それは&quot;として表され、文字Σは&#x3A3;として表されます。&quot;,&#x3A3;を使用します。&<は常に&amp;&lt;としてエクスポートされます。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換します。

  • ICUメッセージを解析する

    ICUメッセージは自動的にタグに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。

  • XMLエンティティをインポート

    DTD宣言内のXMLエンティティは翻訳のためにインポートされます。

  • カスタム一般エンティティを展開

  • コメントをインポート

    要素がHTMLとして処理される要素オプションで示されているようにHTMLとして処理される場合、コメントはインポートされません。

  • セグメンテーションからサブ要素を除外

    XMLペアタグやサブ要素内のセグメンテーションを防ぐために選択します。これは、XMLがネストされた構造を含む場合に便利で、セグメンテーションがテキストの論理的意味を壊すことになります。

  • XSLTプレビューファイルを作成

    .XSLスタイルシートをアップロードし、そこから読み取り可能なプレビューファイルを生成できます。

XPathを使用したXML設定

XPathクエリ言語を使用することで、複雑なインポートルールの作成や、通常のインポートルールでは利用できない追加機能を利用できます。

XPath式は、翻訳されるべきテキスト/値を持つ要素および/または属性を定義し、実際のテキストノードではありません。

使用する前にXPathに慣れておくことをお勧めします。

コンテキストメモコンテキストキー、および最大ターゲット長は、10,000以上のXML要素を持つファイルでは処理されません。

  • コンテキストキー

    該当する場合、TMコンテキスト(101%一致)を構成します。

  • コンテキストメモ

    要素または各要素のコンテキスト属性をインポートします。

  • 訳文の最大長さ

    要素または各要素の最大訳文文長をインポートします。各セグメントの文字数制限は、エディタ内のコンテキストメモビューに表示されます。制限を超えた文字は赤で強調表示されます。

  • 空白箇所を維持

    要素内の空白を維持するには空欄のままにしてください。すべての要素内の空白を維持するにはxml:whitespace='preserve'. //*を適用するか、任意のXPath式を使用してください。

  • セグメンテーションから除外されたノード

    セグメント化しないXML要素または属性を指定してください。除外するノードを特定するXPath式を入力してください。これらのノードから抽出されたテキストは、より小さな単位に分割されるのではなく、単一のセグメントとして保持されます。

    セグメンテーションから属性attr="value"を含むすべての<element>ノードを除外するには//element[@attr='value']を入力してください。

HTMLプレビューとXSLTスタイルシート

XSLT言語(拡張スタイルシート言語変換)を使用して、.XML文書をコンテキスト内プレビュー目的のために.HTML形式に変換できます。したがって、ドキュメントメニューのプレビュー訳文を介してダウンロードされたプレビューファイルは、HTML拡張子が付いています。Phraseは現在XSLT 2.0をサポートしています。

プレビューに使用されるXSLTは、ソースではなくターゲットに基づいている必要があります。

スタイルシートをインポートするにはファイルを選択をクリックしてください。

ファイルインポート後にスタイルシートをダウンロードするにはXSLTをダウンロードをクリックしてください。

XMLファイルのCDATA

CDATAは文字データを意味し、パーサーによって処理されないがマークアップとして認識されるテキストのブロックとして定義される。&lt;,&gt;、および&amp;のような事前定義されたエンティティは入力が必要であり、一般的にマークアップ内で読みづらい。そのような場合、CDATAセクションを使用することができる。

CDATAに埋め込まれた.HTMLが含まれている場合、対応するXML要素は要素(HTMLとして処理される)の下にリストされるべきである。

ソースファイルにCDATAが含まれており、セグメントXMLが使用される場合、CDATAは完了したファイルのすべてのセグメントに追加される。

CDATAは、句読点やスペースなどのセグメントの区切りの明確な指示がある場合にのみセグメント化される。

ソース:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

ターゲット:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

完了したファイルは有効な.XMLであり、XMLビューワーはテキストを翻訳可能なテキストA。翻訳可能なテキストBとして正しく表示する。

アプリケーション固有の設定

Wordpress XML

Wordpress XMLの推奨設定:

  • XML

    XPath

  • 要素と属性

    //*[local-name()='encoded']|//description|//title

  • 要素(HTMLとして処理される)

    //*[local-name()='encoded']|//description|//title

  • フレーズタグに変換

    (\[[^\]]++\])++

ホワイトスペースを保持するHTML設定の下で選択します。

多言語XML

多言語ファイルは、インポート前にマッピングされた言語を持つ複数のバイリンガルジョブとしてインポートされます。それらはmultilingual_xml.pngジョブテーブルに表示されます。複数のターゲット言語にインポートされた場合、完了ファイルはすべてのターゲット言語で構成されます。

フレーズは、ターゲットが空であっても、すべての段落に対してソースおよびターゲット要素の両方を持つXMLファイルをサポートします。ソースとターゲットのセグメンテーションが異なる場合、ソースのセグメンテーションが決定的です。

個々の言語要素はすべて同じtrans-unit要素の子孫でなければならず、一つの言語が他の言語の中に含まれることはできません。ソースとターゲットのコンテンツは属性値に保存できません。trans-unit要素内でソースまたはターゲットのXPathに一致する複数の要素がある場合、最初のもののみが翻訳のためにインポートされます。

  • ジョブを作成する際は、インポートオプションを適用する前に多言語XMLファイルタイプペインから選択します。指定されていない場合、ファイルは標準の.XMLとしてインポートされます。

  • ソース.XMLファイルのタグコンテンツは、タグを展開するツールメニューの下でクリックすることでエディタに表示され、F2をクリックすることで編集できます。

例:

英語からドイツ語およびフランス語への部分的に翻訳されたテキストのサンプル。すべての<tuv lang="en"><tuv lang="de">および<tuv lang="fr">は同じ<tu>要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳不可能なテキスト。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>最初のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg>最初のセグメント</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>第二のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポートオプション

多言語.XMLファイルのインポートには、XPathクエリ言語を使用する必要があります。参考のために上記の例を参照してください。XPath式は、テキスト/値が翻訳されるべき要素を定義し、実際のテキストノードではありません。

  • ソースおよびターゲットのサブ要素を含む要素

    //tu

  • ソーステキストを含む要素

    tuv[@lang='en']/seg(親要素//tuに関連)

  • 翻訳不要のインライン要素

    ソースまたはターゲットのすべての要素は、ここで翻訳不要インライン要素として指定されない限り、翻訳可能なインライン要素と見なされます。

  • コンテキストキー

    セグメントと共に保存され、マッチコンテキストに使用されるコンテキストキーを指定してください。

  • コンテキストメモ

    要素または各要素のコンテキスト属性をインポートします。

  • 訳文の最大長さ

    要素または各要素の最大訳文文長をインポートします。

  • 文字実体へ変換

    出力ファイルに文字参照のリスト(カンマで区切る)を入力してください。

    例:

    引用符(")が必要な場合、それは&quot;として表され、文字Σは&#x3A3;として表されます。&quot;,&#x3A3;を使用します。&<は常に&amp;&lt;としてエクスポートされます。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換します。

  • ICUメッセージを解析する

    ICUメッセージは自動的にタグに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。

  • HTMLサブフィルターを使用する 

    ファイルに含まれるHTMLタグをインポートします。タグはHTMLファイルインポート設定で使用できます。段落タグ<p>は、多言語XMLセグメントが未選択であっても新しいセグメントを作成します。

  • HTMLサブフィルターを使用する

    ファイルに含まれるHTMLタグをインポートします。タグはHTMLファイルインポート設定で使用できます。

  • 多言語XMLセグメント

    テキストは、セルごとに1つのセグメントではなく、一般的なセグメンテーションルールによってセグメント化されます。

    注意

    訳文を含むファイルにセグメント多言語XMLを適用すると、原文と訳文のセグメント数が異なる場合があります。

  • 空でないターゲットのセグメントステータスを設定する 

    デフォルトの確認ステータスを選択し、確認済みのセグメントがTMに自動的に追加されるかどうかを選択します。

  • XSLTプレビューファイルを作成

    .XSLスタイルシートをアップロードし、そこから読み取り可能なプレビューファイルを生成できます。

例::

多言語の.XMLに名前空間が含まれている場合、XPathは次のようになります:

  • ソースおよびターゲットのサブ要素を含む要素

    //*[local-name()='trans-unit']

  • ソーステキストを含む要素

    *[local-name()='source']

  • 訳文を含む要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.