ファイルインポートの設定

.XML - 拡張マークアップ言語(TMS)

コンテンツはPhrase Translateの機械翻訳で英語から翻訳されました。

.XML ファイル形式は翻訳用に設計されていないため、正常にインポートするには追加の設定が必要です。

既定の設定では、アスタリスク (*) でマークされ、すべての XML 要素が翻訳用にインポートされます。インポート オプションを使用して、インポートの動作を変更できます。

ファイルの種類

  • .XML

インポートオプション

平易なインポートルール

XPath を使用した XML 設定

XPath クエリ 言語 を使用すると、複雑なインポートルールや、プレーンなインポートルールでは使用できないいくつかの追加機能を作成できます。

XPath 式は、実際のテキストノードではなく、テキスト/値を翻訳する要素や属性を定義する必要があります。

使用する前に、XPath に精通していることをお勧めします。

コンテキスト メモ, 、コンテキスト キー, 、および最大訳文長は、XML 要素が 10,000 を超えるファイルでは処理されません。

  • コンテキストキー

    該当する場合はTM コンテキスト(101%一致)を構成します。

  • コンテキスト メモ

    各要素の要素またはコンテキスト属性をインポートします。

  • 最大訳文長さ

    要素をインポートするか、各要素の最大訳文長。各セグメントの文字制限は、エディター内のコンテキスト ノートウィンドウに表示されます 制限を超える文字は赤で強調表示されます。

  • 空白を保持する

    要素内の空白を保持するには、空のままにします。xml:whitespace='preserve'. //* を適用 してすべての要素のすべての空白を保持するか、任意の XPath 式を使用します。

XSLT スタイルシートを使用した HTML プレビュー

XSLT 言語 (拡張スタイルシート言語変換) を使用すると、コンテキスト内プレビュー の 目的で.XMLドキュメントを.HTML形式に変換できます。したがって、[ドキュメント ]メニューのプレビュー翻訳 を介して ダウンロード済プレビューファイルには、HTML拡張子が付いています。Phrase は現在 XSLT 2.0 をサポートしています。

「ファイル を選択」をクリックして 、スタイルシートインポートします。

「XSLT のダウンロード」をクリックして 、ファイル インポート後にスタイルシートをダウンロードします。

XML ファイル の CDATA

CDATA は文字データを意味し、パーサーによって処理されないがマークアップとして認識されるテキストのブロックとして定義されます。<、>, 、 & などの 定義済みのエンティティは入力が必要であり、通常、マークアップで読み取りことは困難です。 このような場合は、CDATA セクションを使用できます。

CDATA に埋め込み.HTMLが含まれている場合は、対応する XML 要素が [要素 (HTML として処理)]の下に 一覧表示されます。

原文ファイルに CDATA が含まれていて、セグメント XML が使用されている場合、 CDATA は完了ファイル内のすべてのセグメントに追加済されます。

CDATA は、句読点やスペースなどのセグメント区切りのクリア表示がある場合にのみセグメント化されます。

源:

<テキスト><![CDATA[翻訳可能 テキスト A. 翻訳可能 テキスト B.]]></テキスト>

ターゲット:

<テキスト><![CDATA[翻訳対象テキストA.]]><![CDATA[ ]]><![CDATA[翻訳対象テキストB.]]></テキスト>

完成したファイルは.XML有効であり、XML ビューアはテキスト A として テキストを正しく表示します。 テキスト B翻訳可能翻訳可能。

アプリケーション固有の設定

ワードプレス XML

ワードプレスXMLの推奨設定:

  • XML

    XPath

  • 要素と属性

    //*[local-name()='encoded']|//description|//title

  • 要素 (HTML として処理)

    //*[local-name()='encoded']|//description|//title

  • Phrase タグに変換

    (\[[^\]]++\])++

選択 HTML 設定で 空白 を保持します。

多言語 XML

多言語ファイルは、インポート前に言語がマップされた複数のバイリンガルジョブとしてインポートされます。これらは、 ジョブ テーブルでmultilingual_xml.pngaltalt で 表されます。複数のターゲット言語にインポートした場合、 完了 ファイルはすべてのターゲット言語で構成されます。

Phrase では、訳文が空の場合でも、すべての段落に 原文 要素と 訳文 要素の両方が存在する XML ファイルがサポートされています。原文とターゲットのセグメンテーションが異なる場合、ソースのセグメンテーションが決定します。

個々の言語要素はすべて同じトランスユニット要素の子孫である必要があり、一方の言語をもう一方の要素に含めることはできません。ソースと訳文 コンテンツをタグ属性値に格納することはできません。トランスユニット要素内の XPath 原文または訳文の複数の要素一致場合、最初の要素のみが翻訳のためにインポートされます。

例:

英語からドイツ語とフランス語に部分的に翻訳されたテキストのサンプル。すべての <tuv lang="en">、<tuv lang="de"> および <tuv lang="fr"> は、同じ <tu>, 要素の子です。

<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳対象外のテキスト。
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>First segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste セグメント</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <セグ>セカンドセグメント.</セグ>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

インポートオプション

多言語.XML ファイルインポートには、 XPath クエリ 言語を使用する必要があります。参考資料については、上記の例を参照してください。XPath 式は、実際のテキスト ノードではなく、テキスト/値を翻訳する要素を定義します。

  • 原文 および 訳文 サブ要素を含む要素

    //tu

  • 原文を含む要素

    tuv[@lang='en']/seg (親要素 //tuに関連して)

  • 訳文を含む要素

    tuv[@lang='de']/seg (paコンテキストノート rent 要素 に関連して //tu)

  • 訳文を含む要素

    tuv[@lang='fr']/seg (親要素 //tuに関連して)

  • インライン要素の翻訳不要箇所

    原文 または 訳文 内のすべての要素は、ここでインライン要素として指定されていない限り翻訳不要箇所インライン要素翻訳可能と見なされます。

  • Phrase TMS タグに変換

    正規表現 を適用 して、指定したテキストをタグに変換します。

  • コンテキストキー

    翻訳メモリへのセグメントとともに保存済され、一致 コンテキストに使用されるコンテキストキー を指定します。

  • コンテキスト メモ

    各要素の要素またはコンテキスト属性をインポートします。

  • 最大訳文長さ

    インポート要素または各要素の最大訳文長

  • 文字エンティティへの変換

    文字参照のリストをコンマで区切って出力ファイルに入力します。

    例:

    引用符 (")が必要な場合は ", として表され、文字 Σ は &#x3A3; use 'quot;,&#x3A3; として表 されます & と < は、常にそれぞれ & と < として エクスポートされます。

  • ICU メッセージの解析

    ICU メッセージは自動的に タグ に変換されます。ICU メッセージを含むファイルには、インライン要素を含めることはできません。

  • HTML サブフィルタ使用

    ファイルに含まれる HTML タグをインポートします。タグは、HTML ファイルのインポート設定で使用できます。段落 タグ <p> は、[多言語 XML のセグメント化] が選択されていない場合でも 作成 新規 セグメントされます。

  • XML 多言語セグメント

    テキストは、セルごとに 1 つのセグメントではなく、一般的な セグメンテーションルール によってセグメント化されます。

    注意

    訳文を含むファイルに Segment 多言語 XML を適用する と、原文と訳文で異なる数のセグメントが発生する場合があります。

  • 空でない訳文のセグメント ステータスを設定する

    選択 デフォルト確認ステータスと、確定済 セグメントが自動的にTM追加済されるかどうか。

次に例を示します

多言語 .XMLに名前空間が含まれている場合、XPath は次のようになります。

  • 原文 および 訳文 サブ要素を含む要素

    //*[local-name()='trans-unit']

  • 原文を含む要素

    *[local-名前()='source']

  • 訳文を含む要素

    *[local-name()='target']

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.