XMLファイル形式は翻訳用に設計されておらず、成功するインポートには追加の設定が必要です。
デフォルト設定はアスタリスク(*)でマークされ、すべてのXML要素が翻訳のためにインポートされます。インポートオプションはインポートの動作を変更するために使用できます。
AIサービスは、.XMLベースのファイルの形式の問題を特定するのに非常に効果的です。
ファイル形式
-
.XML
インポートオプション
プレーンインポートルール
-
選択された要素(例:名前、タイトル、段落)のみがインポートされます。アスタリスク()はすべての要素をインポートします。
-
選択された属性(例:名前、タイトル、段落)のみがインポートされます。アスタリスク()はすべての属性をインポートします。
-
オプションが選択されている場合、翻訳可能なテキスト内のすべての要素は翻訳可能なインライン要素としてインポートされます。
-
選択されたインライン要素名前、タイトル、段落はタグに変換され、コンテンツは翻訳可能ではなくなります。
-
テキストノードの隣にある要素は自動的にインラインタグに変換されます。
-
選択された要素コードは.HTMLとして処理されます。.HTMLインポート設定(ホワイトスペースを保持や改行タグ(<br/>)が新しいセグメントを作成など)は、これらの要素に使用できます。
選択された要素の値に.HTMLマークアップが含まれている場合は、このオプションを使用します。特に指定されない限り、選択された要素の子には適用されません。
-
選択された要素はロック済としてインポートされます。
-
選択された属性はロック済としてインポートされます。
-
出力ファイルにカンマで区切った文字参照の一覧を入力してください。
例:
-
正規表現を使用して、指定されたテキストをタグに変換。
-
ICUメッセージは自動的にtagsに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。
-
DTD宣言のXMLエンティティは翻訳のためにインポートされます。
-
-
要素がHTMLとして処理される場合、コメントはインポートされません。これはHTMLとして処理された要素オプションで示されています。
-
XMLペアタグやサブ要素内のセグメンテーションを防ぐために選択してください。これは、XMLにネストされた構造が含まれている場合に便利で、セグメンテーションがテキストの論理的意味を壊すことになります。
-
.XSLスタイルシートをアップロードし、そこから読みやすいプレビューファイルを生成できます。
XPathを使用したXML設定
XPathクエリ言語を使用すると、複雑なインポートルールの作成や、通常のインポートルールでは利用できない追加機能を利用できます。
XPath式は、翻訳されるべき要素や属性のテキスト/値を定義し、実際のテキストノードではない必要があります。
使用する前にXPathに慣れておくことをお勧めします。
、、およびは、10,000以上のXML要素を持つファイルでは処理されません。
-
TMコンテキスト(101%一致)を構成します(該当する場合)。
-
各要素の要素またはコンテキスト属性をインポートします。
-
要素または各要素の最大訳文文長をインポートします。各セグメントの文字数制限は、エディタ内のビューに表示されます。制限を超えた文字は赤で強調表示されます。
-
要素内の空白を保持するために空のままにします。すべての要素内の空白を保持するためにxml:whitespace='preserve'. //*を適用するか、任意のXPath式を使用します。
-
セグメント化されるべきでないXML要素または属性を指定します。除外するノードを特定するXPath式を入力します。これらのノードから抽出されたテキストは、より小さな単位に分割されるのではなく、単一のセグメントとして保持されます。
//element[@attr='value']を入力して、属性
attr="value"を含むすべての<element>ノードを除外します。
HTMLプレビューとXSLTスタイルシート
XSLT言語(拡張スタイルシート言語変換)は、.XMLドキュメントを.インコンテキストプレビュー目的のために.HTML形式に変換するために使用できます。したがって、ドキュメントメニューのプレビュ翻訳を介してダウンロードされたプレビューファイルは、HTML拡張子が付いています。Phraseは現在XSLT 2.0をサポートしています。
プレビューに使用されるXSLTは、ソースではなくターゲットに基づいている必要があります。
スタイルシートをインポートするには、ファイルを選択をクリックします。
ファイルをインポートした後、スタイルシートをダウンロードするには、XSLTをダウンロードをクリックします。
XMLファイルのCDATA
CDATAは文字データを意味し、パーサーによって処理されず、マークアップとして認識されるテキストのブロックとして定義されます。<,、>、および&のような事前定義されたエンティティは、入力が必要であり、一般的にマークアップ内で読みづらいです。そのような場合、CDATAセクションを使用できます。
CDATAに埋め込まれた.HTMLが含まれている場合、対応するXML要素はの下にリストする必要があります。
ソースファイルにCDATAが含まれていて、が使用されている場合、CDATAは完了したファイルのすべてのセグメントに追加されます。
CDATAは、句読点やスペースなどのセグメントの区切りが明確に示されている場合にのみセグメント化されます。
ソース:
<text><![CDATA[翻訳可能なテキストA。翻訳可能なテキストB。]]></text>
ターゲット:
<text><![CDATA[翻訳可能なテキストA。]]><![CDATA[ ]]><![CDATA[翻訳可能なテキストB。]]></text>
完了したファイルは有効な.XMLであり、XMLビューワーはテキストを翻訳可能なテキストA。翻訳可能なテキストBとして正しく表示します。
多言語ファイルは、インポート前にマッピングされた言語で複数のバイリンガルジョブとしてインポートされます。それらはでジョブテーブルに表されます。複数のターゲット言語にインポートされた場合、完了ファイルはすべてのターゲット言語で構成されます。
フレーズは、ターゲットが空であっても、すべての段落に対してソースおよびターゲット要素の両方を持つXMLファイルをサポートします。ソースとターゲットのセグメンテーションが異なる場合、ソースのセグメンテーションが決定的です。
個々の言語要素はすべて同じtrans-unit要素の子孫でなければならず、一つの言語が他の言語の中に含まれることはできません。ソースとターゲットのコンテンツは属性値に保存できません。trans-unit要素内のソースまたはターゲットのXPathに一致する複数の要素がある場合、翻訳のためにインポートされるのは最初のものだけです。
-
ジョブを作成する際は、インポートオプションを適用する前にペインからを選択してください。指定されていない場合、ファイルは標準の.XMLとしてインポートされます。
-
ソース.XMLファイルのタグコンテンツは、メニューの下でタグを展開をクリックすることでエディタに表示され、F2をクリックすることで編集できます。
例:
英語からドイツ語およびフランス語への部分的に翻訳されたテキストのサンプル。すべての<tuv lang="en">、<tuv lang="de">および<tuv lang="fr">は同じ<tu>要素の子です。
<?xml version="1.0" encoding="utf-8"?>
<root>
翻訳不要のテキスト。
<tu note="context note" key="ID 254" maxlen="16">
<tuv lang="ja">
<seg>最初のセグメント。</seg>
</tuv>
<tuv lang="de">
<seg>Erste segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="別のコンテキストメモ" key="ID 255" maxlen="18">
<tuv lang="ja">
<seg>第二のセグメント。</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
インポートオプション
多言語.XMLファイルのインポートには、XPathクエリ言語を使用する必要があります。参考のために上記の例を参照してください。XPath式は、テキスト/値が翻訳されるべき要素を定義し、実際のテキストノードではありません。
-
//tu -
tuv[@lang='ja']/seg(親要素//tuに関連して) -
ソースまたはターゲットのすべての要素は、ここで翻訳不要のインライン要素として指定されていない限り、翻訳可能なインライン要素と見なされます。
-
セグメントと共に保存され、マッチコンテキストに使用されるコンテキストキーを指定してください。
-
各要素の要素またはコンテキスト属性をインポートします。
-
要素または各要素の最大訳文文長をインポートします。
-
出力ファイルにカンマで区切った文字参照の一覧を入力してください。
例:
-
正規表現を使用して、指定されたテキストをタグに変換。
-
ICUメッセージは自動的にtagsに変換されます。セグメントにインライン要素が含まれている場合、そのセグメントのICU解析はスキップされます。インライン要素がないセグメントは通常通り解析されます。
-
ファイルに含まれる HTMLタグをインポートします。タグはその後、HTMLファイルインポート設定で使用できます。段落タグ
<p>は、新しいセグメントを作成します。たとえ が未選択であっても。 -
ファイルに含まれる HTMLタグをインポートします。タグはその後、HTMLファイルインポート設定で使用できます。
-
テキストは、一般的な セグメンテーション ルール によってセグメント化され、セルごとに1つのセグメントではありません。
注意
をターゲットテキストを含むファイルに適用すると、ソースのセグメント数がターゲットのセグメント数と異なる場合があります。
-
デフォルトの確認ステータスを選択し、確認済みのセグメントが自動的にTMに追加されるかどうかを選択します。
-
.XSLスタイルシートをアップロードし、そこから読みやすいプレビューファイルを生成できます。
例: