ファイルインポートの設定

.XML - Extensible Markup Language (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

.XMLファイル形式は翻訳用に設計されていないため、インポートを成功させるには追加の設定が必要です。

デフォルト設定では、アスタリスク(*)が付き、翻訳対象のすべての XML 要素がインポートされます。インポート オプションを使用してインポート動作を変更できます。

AIチャットボットは、.XMLベースのファイルのファイル形式の問題を特定するのに非常に効果的です。

ファイル形式

  • .XML

インポートオプション

プレーンインポート規則

  • タグ要素

    選択した要素 (name、title、para) のみがインポートされます。アスタリスク(*)は、すべての要素をインポートします。

  • タグ属性

    選択した属性 (name、title、para) のみがインポートされます。アスタリスク(*)は、すべての属性をインポートします。

  • 翻訳可能インライン要素

    インライン要素を自動的に特定 オプションを選択した場合、翻訳可能テキスト内のすべての要素が翻訳可能インライン要素としてインポートされます。

  • 翻訳不要インライン要素

    選択されたインライン要素名、タイトル、para は tags に変換され、コンテンツは翻訳不可能です。

    注意

    tags に関する問題は、特にスプレッドシート (MS Excel ベース) や .XML などのファイル形式のエクスポート エラーの一般的な原因です。品質管理チェックを実行して、ファイルをエクスポートする前に tags と format が常に正しいことを確認します。

  • インライン要素を自動的に判別する

    テキストノードの隣接要素は、自動的にinline tagsに変換されます。

  • HTMLとして処理する要素

    選択した要素コードは .HTML として処理されます。空白を維持または改行タグ (<br/>) などの .HTML インポート設定は、これらの要素に新しいセグメントを作成できます。

    このオプションは、選択した要素値に .HTML マークアップが含まれている場合に使用します。特に指定がない限り、選択した要素の子には適用されません。

  • ロック済要素

    選択した要素はロック済としてインポートされます。

  • ロック済属性

    選択した属性はロック済としてインポートされます。

  • Parse ICUメッセージ

    ICUメッセージは自動的にtagsに変換されます。ICUメッセージを含むセグメントには、インライン要素を含めることはできません。

  • XMLエンティティをインポート

    DTD 宣言内の XML エンティティは翻訳用にインポートされます。

  • セグメントXML

    セグメンテーションが必要でない場合は、選択を解除します。

  • コメントをインポート

    要素が [要素 (HTML として処理)] オプションで指定されている HTML として処理される場合、コメントはインポートされません。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換。

  • 文字実体へ変換

    出力ファイルに文字参照の一覧(カンマ区切り)を入力します。

    例:

    引用符(")が必要な場合、文字 Σ は &quot; として表され、&x3A3; 使用 &quot;、&x3A3; として表されます。& はそれぞれ常に &amp;&lt; としてエクスポートされます。

XPath を使用した XML 設定

XPath クエリ言語を使用すると、複雑なインポート規則の作成や、プレーン インポート規則では利用できない追加機能の一部を使用できます。

XPath エクスプレッションは、実際のテキスト ノードではなく、テキスト/値を翻訳する必要のある要素および/または属性を定義する必要があります。

使用する前に、XPath の知識(推奨)

コンテキストメモコンテキストキー、および訳文最大長は、10,000 を超える XML 要素を持つファイルでは処理されません。

  • コンテキストキー

    TMコンテキスト(101%一致)を構成します(該当する場合)。

  • コンテキストメモ

    各要素のインポート要素またはコンテキスト属性。

  • 訳文の最大長さ

    要素または各要素の最大訳文文長をインポートします。各セグメントの文字数制限は、エディタ内のコンテキストメモビューに表示されます。制限を超えた文字は赤で強調表示されます。

  • 空白箇所を維持する

    Keep empty で要素内の空白箇所を保持します。xml:whitespace='preserve'. //* を適用して、すべての要素ですべての空白箇所を保持するか、任意の XPath エクスプレッションを使用。

XSLT スタイルシートを使用した HTML プレビュー

XSLT言語(Extensible Stylesheet Language Transformation)を使用すると、文書内プレビュー用に.XMLドキュメントを.HTML形式に変換できます。したがって、ドキュメントメニューのプレビュー翻訳でダウンロードしたファイルのプレビューには、HTML 拡張子が付いています。phraseは現在XSLT 2.0をサポートしています。

スタイルシートをインポートするファイルを選択をクリックします。

「XSLT ダウンロード」をクリックして、ファイルインポート後にスタイルシートをダウンロードします。

XML ファイルの CDATA

CDATA は文字データを意味し、パーサーで処理されないがマークアップとして認識されるテキストのブロックとして定義されます。&lt;、&gt;&amp; などの定義済みエンティティは入力が必須であり、一般的にマークアップでは読みにくいです。このような場合、CDATAセクションを使用できます。

CDATAに埋め込まれた.HTMLが含まれる場合、対応するXML要素は要素(HTMLとして処理)の下にリストする必要があります。

原文ファイルに CDATA が含まれ、セグメント XML が使用されている場合、CDATA は完了ファイルの各セグメントに追加されます。

CDATAは、句読点や間隔などのセグメント区切りがクリアされている場合にのみセグメント化されます。

出典:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

訳文:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

訳文完成ファイルは有効な .XML であり、XML ビューアではテキストは翻訳可能テキスト A と正しく表示されます。翻訳可能テキスト B

アプリケーション固有の設定

Wordpress XML

WordPress XMLの推奨設定:

  • XML

    XPath

  • 要素と属性

    //*[local-name()='encoded']|//description|//title

  • HTMLとして処理する要素

    //*[local-name()='encoded']|//description|//title

  • Phraseタグに変換する

    (\[[^\]]++\])++

HTML設定の[Preserve whitespaces]を選択

多言語XML

多言語ファイルは、インポート前に言語がマップされた複数のバイリンガルジョブとしてインポートされます。ジョブは、ジョブ・テーブルにmultilingual_xml.pngで表示されます。複数の訳文言語にインポートされた場合、完了ファイルはすべての訳文言語で構成されます。

phraseは、訳文がemptyの場合でも、すべての段落に原文と訳文の両方の要素を含むXMLファイルをサポートします。原文と訳文のセグメンテーションが異なる場合、原文セグメンテーションを決定します。

個々の言語要素はすべて同じトランスユニット要素の子孫である必要があり、一方の言語を他方に含めることはできません。原文と訳文文のコンテンツを属性値に保存することはできません。複数の要素がトランスユニット要素内の原文または訳文の XPath と一致する場合、最初の 1 つだけが翻訳用にインポートされます。

  • ジョブを作成するときは、インポート オプションを適用する前にファイル タイプ ペインで多言語 XML を選択します。指定がない場合、ファイルは標準の.XMLとしてインポートされます。

  • 原文 .XML ファイルのタグコンテンツは、「ツール」メニューの「Expand tags」をクリックしてエディタで表示し、F2 キーを押して編集できます。

例:

英語からドイツ語、フランス語への一部翻訳のサンプル。すべての <tuv lang="en"><tuv lang="de"> および <tuv lang="fr"> は同じ <tu> 要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳可能テキストではありません。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>最初のセグメント</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste セグメント</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="別コンテキストメモ" キー="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>2番目のセグメント</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポートオプション

多言語 .XML ファイルのインポートには、XPath クエリ言語を使用する必要があります。参考資料として、上記の例を参照してください。XPath 式は、実際のテキスト ノードではなく、テキスト/値が翻訳される要素を定義します。

  • 原文と訳文のサブ要素を含む要素

    //tu

  • 原文テキストを含む要素

    tuv[@lang='en']/seg (親要素 //tu に対する)

  • 訳文テキストを含む要素

    tuv[@lang=`de`]/seg (paコンテキストメモの rent 要素 //tu に対する)

  • 訳文テキストを含む要素

    tuv[@lang='fr']/seg (親要素 //tu に対する)

  • 翻訳不要インライン要素

    ここで翻訳翻訳不要箇所インライン要素とみなされます。

  • Phrase TMSタグに変換する 

    正規表現を使用して、指定されたテキストをタグに変換。

  • コンテキストキー

    セグメントとともに翻訳メモリに保存し、一致コンテキストに使用するコンテキストキーを指定します。

  • コンテキストメモ

    各要素のインポート要素またはコンテキスト属性。

  • 訳文の最大長さ

    インポート要素または各要素の最大訳文長

  • 文字実体へ変換

    出力ファイルに文字参照の一覧(カンマ区切り)を入力します。

    例:

    引用符(")が必要な場合、文字 Σ は &quot; として表され、&x3A3; 使用 &quot;、&x3A3; として表されます。& はそれぞれ常に &amp;&lt; としてエクスポートされます。

  • Parse ICUメッセージ

    ICUメッセージは自動的にtagsに変換されます。ICUメッセージを含むセグメントには、インライン要素を含めることはできません。

  • HTMLサブフィルターを使用する 

    ファイルに含まれる HTMLタグをインポートします。tagsはHTMLファイルインポート設定で使用できます。「セグメント多言語 XML」が選択されていなくても、「paragraph tags <p>」は新しいセグメントを作成します。

  • セグメント多言語XML

    テキストは、セルごとに 1 つのセグメントではなく、一般的なセグメンテーション規則によってセグメント化されます。

    注意

    訳文を含むファイルにセグメント多言語 XML を適用すると、原文と訳文のセグメント数が異なることがあります。

  • 空でないターゲットのセグメントステータスを設定する 

    デフォルトの確定ステータスと確定済済セグメントを自動的にTMに追加するかどうかを選択します。

例:

多言語 .XML に名前空間が含まれる場合、XPath は次のようになります。

  • 原文と訳文のサブ要素を含む要素

    //*[local-name()='trans-unit']

  • 原文テキストを含む要素

    *[local-name()='source']

  • 訳文テキストを含む要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.