プロジェクト管理

Segmentation Rules (TMS)

本コンテンツはPhrase Language AIの機械翻訳により、英語から翻訳されています。

セグメンテーション

セグメンテーションとは、原文をより小さな部分に分割することです。これにより、翻訳メモリから以前に翻訳したテキストを読み出せます。セグメントはエディタで表示され、フィルタリングできます。

デフォルトのセグメンテーション規則は、各サポート言語の詳細に対応しており、カスタマイズできます。

不適切なドキュメント ファイルや不適切なセグメンテーション カスタマイズの適用など、不適切なセグメンテーションでインポートされたジョブは、TM 一致値に影響を与えることがあります。

例:

適切なセグメンテーション:

  • 多言語訳文言語による翻訳メモリがサポートされており、双方向で使用できます。

    一致値 100%。

低セグメンテーション

  • 多言語訳文言語による翻訳メモリがサポートされています。

    一致値 100%。

  • 双方向で使用できます。

    一致は63%です。

セグメンテーション規則のカスタマイズ

カスタマイズされたセグメンテーション規則をジョブプロジェクトテンプレートに適用できます。プロジェクトでカスタマイズされたセグメンテーション規則が必要な場合は、そのプロジェクト用にテンプレートを作成する必要があります。優先に設定すると、カスタマイズされたセグメンテーション規則が、その原文言語用にインポートされたすべての新規ジョブに適用されます。

セグメンテーション規則には 2 種類があります。

  • .XLSXファイルの略語

  • .SRXファイルの正規表現

カスタマイズされた規則を使用するには、デフォルト規則をダウンロード、変更し、変更後のファイルをアップロードし、指定されたジョブに適用します。

注意

スペースのない CJK 原文言語にカスタム セグメンテーション ルールを追加する場合訳文言語では単語区切りとしてスペースを使用します)、カスタム ルールによって分割された訳文セグメントの先頭または末尾にスペースが追加されるようにします。これにより、翻訳内の単語が区切られます。これは、デフォルトのセグメンテーション規則によって形成されるセグメントでは自動的に行われますが、手動分割セグメントや追加のカスタム セグメンテーション規則によって形成されるセグメントでは、スペースは追加されません。

デフォルト セグメンテーション規則のダウンロード

デフォルトのセグメンテーション規則をダウンロードするには、次の手順に従います。

  1. 設定Setup_gear.png ページで、プロジェクト設定セクションまでスクロールし、セグメンテーションをクリックします。

    セグメンテーションページが開きます。

  2. カスタマイズする言語を選択し、エクスポート XLSX/SRX をクリックします。

    XLSX/SRX エクスポートのウィンドウが開きます。

  3. ファイル形式選択:

    • XLSXには略語一覧があります。

    • SRXは正規表現ルールを提供します。

  4. ドロップダウン一覧から言語を選択します。

  5. ダウンロードをクリックします。

    ファイルがシステムにダウンロードされます。

以前にアップロードしたセグメンテーション規則をダウンロードする手順は、次のとおりです。

  1. 設定Setup_gear.png ページで、プロジェクト設定セクションまでスクロールし、セグメンテーションをクリックします。

    セグメンテーションページが開きます。

  2. 右側の設定アイコンをクリックし、「Customize columns: customize-segmentation-columns.png(列のカスタマイズ)」を選択します。

  3. ファイル名列を有効

  4. ファイル名をクリックして、事前に保存されたルールをダウンロードします。

.XLSX ファイルでの略語の編集

略語は言語ごとに指定でき、その後は新しいセグメントを作成しません。

略語の編集手順は、次のとおりです。

  1. ダウンロードしたファイルをエディタで開きます。

  2. 次のフォーマットで内容を変更:

    XLSX ファイルは、見出しのない 2 つの列を持つ必要があります。

    • 列 1:指定する略語

    • 列 2:セグメンテーション動作の仕様

      • ABBR_UPPER_NUM

        略語の後に空白、数字、記号 (数学、通貨記号、ディンバットなど)、または最初の文字が大文字の単語が続く場合、新しいセグメントは作成されません

      • ABBR_NUM

        略語のあとに空白、数字が続く場合、新しいセグメントは作成されません

  3. 編集した .XLSX ファイルを保存。

.SRX ファイルの正規表現の編集

.SRXファイルの編集は、正規表現の使用経験があるユーザーのみに適した複雑なプロセスです

SRXファイルで変更できるルールはいくつかあります。

  • セグメンテーションなしで XLSX ファイルからテキストをインポート。1 セルは 1 セグメントです。

  • 1 つのセグメントを 2 つに分割オーダーで改行付きテキストをインポート。

  • セグメント区切り文字としてコロン(またはその他の文字)を使用します。

  • セグメント区切り文字としてのセミコロン(またはその他の文字)の使用を禁止します。

  • 一覧から略語を削除します(テキストはセグメント化されます)。

これらの規則は文字ベースです。セグメント区切り文字として使用できるのは 1 文字だけです。文字のグループ(たとえば: <p>)はセグメント区切り文字として使用できません。

SRXファイルの編集手順は、次のとおりです。

  1. Notepad ++ などのテキスト エディタでファイルを開きます。

  2. 正規表現を使用して編集、または内部セグメンテーションを完全に削除。

    例:

    BreakRules_Example.png
    • <rule break="no">

      セグメントが壊れないルールの一覧。略語の一覧

    • <rule> <beforebreak>

      休符の前の文字の正規表現 (たとえば、文の終わりの ".?! :")。たとえば、コロンのあとにセグメントテキストを含めない場合は、すべての <rule><beforebreak> コードから : を削除します。

    • <rule> <afterbreak>

      改行後の文字の正規表現(たとえば、新しい文の先頭、スペース、大文字など)。

  3. 変更したSRXファイルを保存。

新しいセグメンテーション ルールのアップロード

変更または新しいセグメンテーション規則をアップロードするには、次の手順に従います。

  1. 設定Setup_gear.png ページで、プロジェクト設定セクションまでスクロールし、セグメンテーションをクリックします。

    セグメンテーションページが開きます。

  2. [新規] をクリックします。

    カスタムXLSXまたはSRXセグメンテーションファイルのアップロードページが開きます。

  3. ドロップダウン一覧から言語を選択します。

  4. ルールの名前を入力します。

  5. ファイルを選択をクリックします。

    ファイル選択ウィンドウが開きます。

  6. アップロードする変更後の規則ファイルを選択します。

  7. カスタムセグメンテーション規則が、選択した言語のプライマリセグメンテーション規則になる場合は、[Primary] をチェックします。

  8. 作成をクリックします。

    セグメンテーションページが開かれ、ルールが一覧に追加されています。

ジョブインポート時にカスタムセグメンテーション規則を使用

ジョブインポートでカスタム規則を使用するには、次の手順に従います。

  1. ジョブ作成のステップ 8 で、ファイル インポート設定からセグメンテーションとセグメント長をクリックします。

    セグメンテーションおよびセグメント長オプションのドロップダウンが開きます。

  2. 原文セグメンテーション規則ドロップダウンリストから、変更した規則を選択します。

  3. 作成をクリックします。

    ジョブが作成され、指定されたセグメンテーション規則を使用して一覧に追加されます。

変更セグメンテーション例(1 セル 1 セグメント)

SRXファイルから内部セグメンテーション規則をすべて削除し、段落、要素、またはセル全体の基本セグメンテーションのみを適用します。このセグメンテーション規則は、すべてのファイル タイプ(MS Word、XML、HTML、Excel など)に適用できます。

例:

A

B

1

ピーター!待って!

2

こんにちわ

3

デフォルトのセグメンテーションでインポートされたこのXLSXの例は、3つのセグメントで構成されます。Peter!Wait!、そしてこんにちわ

内側のセグメンテーションがすべて削除され、セルに基づく基本的なセグメンテーションのみが残った場合、セグメントは2つだけになります。Peter!Wait! and Hello.

SRX ファイルを編集して、デフォルトのセグメンテーション規則 (<!-- break rules --></languagerule> の間のコードなど) をすべて削除します。

例:

1cell-1segment-srx.png

カスケードは、この例が仕事にならない原因になることがあります。このような場合は、Notepad++ で編集した SRX ファイルを開き、header 要素の 2 つの属性を見つけ、両方とも no に変更します。

この記事は役に立ちましたか?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.