ファイルインポートの設定

.XML - 拡張マークアップ言語 (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

.XMLファイル形式は翻訳用に設計されていないため、インポートを成功させるには追加の設定が必要です。

デフォルト設定では、アスタリスク(*)が付き、翻訳対象のすべての XML 要素がインポートされます。インポートオプションを使用する送信先、インポートの動作を変更できます。

ファイルの種類

  • .XML

インポート オプション

プレーンインポートルール

  • 要素

    選択要素(名前、タイトル、パラ)のみがインポートされます。アスタリスク(*)は、すべての要素をインポートします。

  • 属性

    選択タグ属性 (名前、タイトル、段落) のみがインポートされます。アスタリスク(*)はすべてタグ属性をインポートします。

  • 翻訳可能インライン要素

    インライン要素を自動的に識別オプションを選択した場合、翻訳可能テキスト内のすべての要素が翻訳可能インライン要素としてインポートされます。

  • 翻訳不要箇所インライン要素

    選択済インライン要素名前、タイトル、パラはタグに変換され、コンテンツは翻訳不可能です。

  • インライン要素を自動的に識別する

    テキストノードの隣接要素は、自動的にインラインタグ送信先に変換されます。

  • 要素 (HTML として処理)

    選択した要素コードは、.HTMLとして処理されます。.HTML (TMS)。空白箇所を保持 や 改行タグ (<br/>) などのHTMLインポート設定は、これらの要素に新しいセグメントを作成することができます。

  • ロック済要素

    選択した要素はロック済としてインポートされます。

  • ロック済タグ属性

    選択したタグ属性はロック済としてインポートされます。

  • ICUメッセージの解析

    ICUメッセージは自動的にタグ送信先に変換されます。ICUメッセージを含むファイルにインライン要素を含めることはできませできない。

  • XMLエンティティのインポート

    DTP 宣言内の XML エンティティは翻訳用にインポートされます。

  • セグメントXML

    セグメンテーションをご希望されない場合は、選択を解除してください。

  • インポート コメント

    要素が [要素 (HTML として処理)] オプションで指定されているように HTML として処理される場合、コメントはインポートされません。

  • Phrase TMS タグ送信先 

    タグ送信先指定テキスト正規表現適用

  • 文字送信先変換

    出力ファイルに文字参考資料の一覧(カンマ区切り切り)を入力します。

    例:

    引用符 (") が必要な場合、 引用符は &quot; として表されます。 文字 Σ は &x3A3; 使用 &quot; 、&#x3A3; として表されます。 &<< はそれぞれ常に &amp;&lt; としてエクスポートされます 。

XPath を使用した XML 設定

XPath クエリ言語を使用すると、複雑なインポート規則を作成でき、通常のインポート規則では利用できない追加機能の一部を使用できます。

XPath 式は、実際のテキストノードではなく、テキスト/値を翻訳する要素および/またはタグ属性を定義する必要があります。

ご使用になる前に、XPath に精通していることをお勧めします。

コンテキストノートコンテキストキー、および訳文最大長は、XML 要素が 10,000 を超えるファイルでは処理されません。

  • コンテキストキー

    必要に応じてTMコンテキスト(101%一致)を構成する。

  • コンテキストノート

    各要素またはコンテキストタグ属性をインポートします。

  • 訳文の最大文字数

    要素または各要素の最大訳文文長をインポートします。各セグメントの文字数制限は、エディタ内のコンテキストノートペインに表示されます。制限を超える文字は赤で強調表示されます。

  • 空白を維持

    送信先を空欄のままにして要素内の空白箇所を保持する。xml:空白'preserve'. //* 送信先要素内の空白箇所、または任意の XPath 表現を使用。

XSLT スタイルシートを使用した HTML プレビュー

XSLT言語(Extensible Stylesheet Language Transformations)は、文書内プレビューの送信先として.XMLドキュメントを.HTMLフォームに変換できます。したがって、「ドキュメント」メニューのプレビュー翻訳でダウンロードするプレビューファイルは、HTML 拡張子付きです。Phraseは現在XSLT 2.0をサポートしています。

スタイルシートのインポート送信先ファイルを選択 をクリックします。

ファイルインポート後のスタイルシートの送信先 XSLT ダウンロード をクリックします。

XMLファイルのCDATA

CDATAは文字データを意味し、パーサーによって処理されないがマークアップとして認識されるテキストのブロックとして定義されます。&lt;、&gt;&amp; などの定義済み実体は入力が必要で、一般にマークアップの送信先が読み取りにくいです。このような場合は、CDATAセクションを使用できます。

CDATA に .HTML が埋め込まれている場合、対応する XML 要素は Elements (processed as HTML) の下に一覧表示されます。

原文ファイルに CDATA が含まれ、セグメント XML を使用する場合、訳文完成ファイルの各セグメント送信先に CDATA が追加されます。

CDATAは、句読点や間隔などのセグメント区切りのクリアな表示がある場合にのみセグメント化されます。

原文:

<text><![CDATA[翻訳可能テキストA.翻訳可能テキストB.]]></text>

訳文:

<TE![CDATA[Translatable TE A.]]><![CDATA[ ]]><![CDATA[Translatable TE B.]]></TE

訳文完成ファイルは有効な .XML であり、XML ビューアにはテキストが翻訳可能テキスト A および翻訳可能テキスト B として正しく表示されます。

アプリケーション特定設定

Wordpress XML

WordPress XML の推奨設定:

  • XML

    XPath

  • 要素とタグ属性

    //*[local-name()='encoded']|//description|//title

  • 要素 (HTML として処理)

    //*[local-name()='encoded']|//description|//title

  • Phrase タグ送信先

    (\[[^\]]++\])++

HTML設定の空白を維持 を選択。

多言語XML

多言語語ファイルは、インポート前に言語がマップされた複数のバイリンガルジョブとしてインポートされます。ジョブ タブでは、これらは multilingual_xml.png で表されます。複数の訳文言語にインポートすると、訳文完成ファイルはすべて訳文言語で構成されます。

Phraseは、訳文が空の場合でも、すべての段落に原文と訳文の両方の要素を含むXMLファイルをサポートします。原文と訳文セグメントが異なる場合、原文セグメントが決定されます。

個々の言語要素はすべて同じトランスユニット要素の子孫でなければならず、ある言語を他の言語に含めることはできませできない。原文コンテンツと訳文コンテンツをタグ属性値に保存することはできない。trans-unit 要素内の原文または訳文の XPath に複数の要素が一致する場合、最初の 1 つだけが翻訳用にインポートされます。

  • ジョブを作成するときは、ファイルの種類ペインで多言語 XML を選択してからインポート オプションを適用します。指定しない場合、ファイルは標準の .XML 形式でインポートされます。

  • 原文 .XML ファイルのタグコンテンツは、「ツール」メニューの「タグの展開」をクリックするとエディタ上で表示され、F2 をクリックすることで編集できます。

例:

英語からドイツ語、フランス語への一部送信先テキストのサンプル。すべての <tuv lang="en"><tuv lang="de">、および <tuv lang="fr"> は同じ <tu> 要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳可能テキストではありません。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>最初のセグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg>最初のセグメント</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>第2セグメント。</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポート オプション

多言語 .XML ファイルのインポートには、XPath クエリ言語を使用する必要があります。参考資料として、上記の例を参照してください。XPath 式は、実際のテキストノードではなく、テキスト/値を翻訳する要素を定義します。

  • 原文と訳文のサブ要素を含む要素

    //tu

  • 原文を含む要素

    tuv[@lang='en']/seg (送信先の親要素 //tu から)

  • 訳文要素

    tuv[@lang='de']/seg (送信先のpaコンテキストノートrent要素 //tuに関連しています)

  • 訳文要素

    tuv[@lang='fr']/seg (送信先の親要素 //tu から)

  • 翻訳不要箇所インライン要素

    翻訳翻訳不要箇所イインライン要素イン要素インライン要素とみなます。

  • Phrase TMS タグ送信先 

    タグ送信先指定テキスト正規表現適用

  • コンテキストキー

    セグメントとともに翻訳メモリ送信先に保存され、一致コンテキストに使用されるコンテキストキーを指定します。

  • コンテキストノート

    各要素またはコンテキストタグ属性をインポートします。

  • 訳文の最大文字数

    要素または各要素の最大訳文文長をインポート

  • 文字送信先変換

    出力ファイルに文字参考資料の一覧(カンマ区切り切り)を入力します。

    例:

    引用符 (") が必要な場合、 引用符は &quot; として表されます。 文字 Σ は &x3A3; 使用 &quot; 、&#x3A3; として表されます。 &<< はそれぞれ常に &amp;&lt; としてエクスポートされます 。

  • ICUメッセージの解析

    ICUメッセージは自動的にタグ送信先に変換されます。ICUメッセージを含むファイルにインライン要素を含めることはできませできない。

  • HTML サブフィルタを使用 

    ファイル内の HTML タグをインポートします。タグは HTML ファイルインポートの設定で使用できます。セグメント多言語 XML が選択されていなくても、段落タグ <p> は新規セグメントを作成します。

  • セグメント多言語XML

    テキストは、セルごとに 1 つのセグメントではなく、一般的なセグメンテーションルールによってセグメント化されます。

    注意

    訳文を含むファイルにセグメント多言語XMLを適用すると、訳文と原文のセグメント番号が異なることがあります。

  • 空でない訳文のセグメントステータスを設定 

    デフォルトの確認ステータスと、確定済済のセグメントがTM送信先自動的に追加済されるかどうかを選択します。

例:

多言語 .XML に名前が含まれる場合、XPath は次のようになります。

  • 原文と訳文のサブ要素を含む要素

    //*[local-name()='trans-unit']

  • 原文を含む要素

    *[local-name()='source']

  • 訳文要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.