ファイルインポートの設定

.XML - Extensible Markup Language (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

XMLファイル形式は翻訳用に設計されておらず、成功するインポートには追加の設定が必要です。

デフォルト設定はアスタリスク(*)でマークされ、すべてのXML要素が翻訳のためにインポートされます。インポートオプションはインポートの動作を変更するために使用できます。

AIサービスは、.XMLベースのファイルの形式の問題を特定するのに非常に効果的です。

ファイル形式

  • .XML

インポートオプション

プレーンインポートルール

  • タグ要素

    選択された要素(例:名前、タイトル、段落)のみがインポートされます。アスタリスク(*)はすべての要素をインポートします。

  • タグ属性

    選択された属性(例:名前、タイトル、段落)のみがインポートされます。アスタリスク(*)はすべての属性をインポートします。

  • 翻訳可能インライン要素

    インライン要素を自動的に識別するオプションが選択されている場合、翻訳可能なテキスト内のすべての要素は翻訳可能なインライン要素としてインポートされます。

  • 翻訳不要インライン要素

    選択されたインライン要素名前、タイトル、段落はタグに変換され、コンテンツは翻訳可能ではなくなります。

    注意

    タグに関する問題は、エクスポートエラー(例:ファイルを生成できませんでした)の一般的な原因であり、特にスプレッドシート(MS Excelベース)や.XMLのようなファイルタイプにおいてです。ファイルをエクスポートする前に、品質管理チェックを実行してタグとフォーマットが正しいことを常に確認してください。

  • インライン要素を自動的に判別する

    テキストノードの隣にある要素は自動的にインラインタグに変換されます。

  • HTMLとして処理する要素

    選択された要素コードは.HTMLとして処理されます。.HTMLインポート設定(ホワイトスペースを保持改行タグ(<br/>)が新しいセグメントを作成など)は、これらの要素に使用できます。

    選択された要素の値に.HTMLマークアップが含まれている場合は、このオプションを使用します。特に指定されない限り、選択された要素の子には適用されません。

  • ロック済要素

    選択された要素はロック済としてインポートされます。

  • ロック済属性

    選択された属性はロック済としてインポートされます。

  • 文字実体へ変換

    出力ファイルにカンマで区切った文字参照の一覧を入力してください。

    例:

    引用符(")が必要な場合、それは&quot;として表され、文字Σは&#x3A3;として表されます。&quot;,&#x3A3;を使用します。&および<は常に&amp;および&lt;としてエクスポートされます。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換。

  • Parse ICUメッセージ

    ICUメッセージは自動的にtagsに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。

  • XMLエンティティをインポート

    DTD宣言のXMLエンティティは翻訳のためにインポートされます。

  • カスタム一般エンティティを拡張

  • コメントをインポート

    要素がHTMLとして処理される場合、コメントはインポートされません。これはHTMLとして処理された要素オプションで示されています。

  • セグメンテーションからサブ要素を除外する

    XMLペアタグやサブ要素内のセグメンテーションを防ぐために選択してください。これは、XMLにネストされた構造が含まれている場合に便利で、セグメンテーションがテキストの論理的意味を壊すことになります。

  • XSLTプレビューファイルを作成

    .XSLスタイルシートをアップロードし、そこから読みやすいプレビューファイルを生成できます。

XPathを使用したXML設定

XPathクエリ言語を使用すると、複雑なインポートルールの作成や、通常のインポートルールでは利用できない追加機能を利用できます。

XPath式は、翻訳されるべき要素や属性のテキスト/値を定義し、実際のテキストノードではない必要があります。

使用する前にXPathに慣れておくことをお勧めします。

コンテキストメモコンテキストキー、および最大ターゲット長は、10,000以上のXML要素を持つファイルでは処理されません。

  • コンテキストキー

    TMコンテキスト(101%一致)を構成します(該当する場合)。

  • コンテキストメモ

    各要素の要素またはコンテキスト属性をインポートします。

  • 訳文の最大長さ

    要素または各要素の最大訳文文長をインポートします。各セグメントの文字数制限は、エディタ内のコンテキストメモビューに表示されます。制限を超えた文字は赤で強調表示されます。

  • 空白箇所を維持

    要素内の空白を保持するために空のままにします。すべての要素内の空白を保持するためにxml:whitespace='preserve'. //*を適用するか、任意のXPath式を使用します。

  • セグメンテーションから除外されたノード

    セグメント化されるべきでないXML要素または属性を指定します。除外するノードを特定するXPath式を入力します。これらのノードから抽出されたテキストは、より小さな単位に分割されるのではなく、単一のセグメントとして保持されます。

    //element[@attr='value']を入力して、属性attr="value"を含むすべての<element>ノードを除外します。

HTMLプレビューとXSLTスタイルシート

XSLT言語(拡張スタイルシート言語変換)は、.XMLドキュメントを.インコンテキストプレビュー目的のために.HTML形式に変換するために使用できます。したがって、ドキュメントメニューのプレビュ翻訳を介してダウンロードされたプレビューファイルは、HTML拡張子が付いています。Phraseは現在XSLT 2.0をサポートしています。

プレビューに使用されるXSLTは、ソースではなくターゲットに基づいている必要があります。

スタイルシートをインポートするには、ファイルを選択をクリックします。

ファイルをインポートした後、スタイルシートをダウンロードするには、XSLTをダウンロードをクリックします。

XMLファイルのCDATA

CDATAは文字データを意味し、パーサーによって処理されず、マークアップとして認識されるテキストのブロックとして定義されます。&lt;,&gt;、および&amp;のような事前定義されたエンティティは、入力が必要であり、一般的にマークアップ内で読みづらいです。そのような場合、CDATAセクションを使用できます。

CDATAに埋め込まれた.HTMLが含まれている場合、対応するXML要素は要素(HTMLとして処理される)の下にリストする必要があります。

ソースファイルにCDATAが含まれていて、セグメントXMLが使用されている場合、CDATAは完了したファイルのすべてのセグメントに追加されます。

CDATAは、句読点やスペースなどのセグメントの区切りが明確に示されている場合にのみセグメント化されます。

ソース:

<text><![CDATA[翻訳可能なテキストA。翻訳可能なテキストB。]]></text>

ターゲット:

<text><![CDATA[翻訳可能なテキストA。]]><![CDATA[ ]]><![CDATA[翻訳可能なテキストB。]]></text>

完了したファイルは有効な.XMLであり、XMLビューワーはテキストを翻訳可能なテキストA。翻訳可能なテキストBとして正しく表示します。

アプリケーション固有の設定

Wordpress XML

Wordpress XMLの推奨設定:

  • XML

    XPath

  • 要素と属性

    //*[local-name()='encoded']|//description|//title

  • HTMLとして処理する要素

    //*[local-name()='encoded']|//description|//title

  • Phraseタグに変換する

    (\[[^\]]++\])++

HTML設定の下で空白を保持するを選択します。

多言語XML

多言語ファイルは、インポート前にマッピングされた言語で複数のバイリンガルジョブとしてインポートされます。それらはmultilingual_xml.pngジョブテーブルに表されます。複数のターゲット言語にインポートされた場合、完了ファイルはすべてのターゲット言語で構成されます。

フレーズは、ターゲットが空であっても、すべての段落に対してソースおよびターゲット要素の両方を持つXMLファイルをサポートします。ソースとターゲットのセグメンテーションが異なる場合、ソースのセグメンテーションが決定的です。

個々の言語要素はすべて同じtrans-unit要素の子孫でなければならず、一つの言語が他の言語の中に含まれることはできません。ソースとターゲットのコンテンツは属性値に保存できません。trans-unit要素内のソースまたはターゲットのXPathに一致する複数の要素がある場合、翻訳のためにインポートされるのは最初のものだけです。

  • ジョブを作成する際は、インポートオプションを適用する前にファイルタイプペインから多言語XMLを選択してください。指定されていない場合、ファイルは標準の.XMLとしてインポートされます。

  • ソース.XMLファイルのタグコンテンツは、ツールメニューの下でタグを展開をクリックすることでエディタに表示され、F2をクリックすることで編集できます。

例:

英語からドイツ語およびフランス語への部分的に翻訳されたテキストのサンプル。すべての<tuv lang="en"><tuv lang="de">および<tuv lang="fr">は同じ<tu>要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳不要のテキスト。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="ja">
    <seg>最初のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="別のコンテキストメモ" key="ID 255" maxlen="18"> 
  <tuv lang="ja">
    <seg>第二のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポートオプション

多言語.XMLファイルのインポートには、XPathクエリ言語を使用する必要があります。参考のために上記の例を参照してください。XPath式は、テキスト/値が翻訳されるべき要素を定義し、実際のテキストノードではありません。

  • 原文と訳文のサブ要素を含む要素

    //tu

  • 原文テキストを含む要素

    tuv[@lang='ja']/seg(親要素//tuに関連して)

  • 翻訳不要インライン要素

    ソースまたはターゲットのすべての要素は、ここで翻訳不要のインライン要素として指定されていない限り、翻訳可能なインライン要素と見なされます。

  • コンテキストキー

    セグメントと共に保存され、マッチコンテキストに使用されるコンテキストキーを指定してください。

  • コンテキストメモ

    各要素の要素またはコンテキスト属性をインポートします。

  • 訳文の最大長さ

    要素または各要素の最大訳文文長をインポートします。

  • 文字実体へ変換

    出力ファイルにカンマで区切った文字参照の一覧を入力してください。

    例:

    引用符(")が必要な場合、それは&quot;として表され、文字Σは&#x3A3;として表されます。&quot;,&#x3A3;を使用します。&および<は常に&amp;および&lt;としてエクスポートされます。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換。

  • Parse ICUメッセージ

    ICUメッセージは自動的にtagsに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。

  • HTMLサブフィルターを使用する 

    ファイルに含まれる HTMLタグをインポートします。タグはその後、HTMLファイルインポート設定で使用できます。段落タグ <p> は、新しいセグメントを作成します。たとえ セグメント 多言語 XML が未選択であっても。

  • HTMLサブフィルターを使用する

    ファイルに含まれる HTMLタグをインポートします。タグはその後、HTMLファイルインポート設定で使用できます。

  • セグメント多言語XML

    テキストは、一般的な セグメンテーション ルール によってセグメント化され、セルごとに1つのセグメントではありません。

    注意

    セグメント 多言語 XML をターゲットテキストを含むファイルに適用すると、ソースのセグメント数がターゲットのセグメント数と異なる場合があります。

  • 空でないターゲットのセグメントステータスを設定する 

    デフォルトの確認ステータスを選択し、確認済みのセグメントが自動的にTMに追加されるかどうかを選択します。

  • XSLTプレビューファイルを作成

    .XSLスタイルシートをアップロードし、そこから読みやすいプレビューファイルを生成できます。

:

多言語の.XMLに名前空間が含まれている場合、XPathは次のようになります:

  • 原文と訳文のサブ要素を含む要素

    //*[local-name()='trans-unit']

  • 原文テキストを含む要素

    *[local-name()='source']

  • 訳文テキストを含む要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.