分析は、選択したファイルの文字数と単語数を計算し、以下を特定します:
分析は、レビュワーによって行われた修正の数も示すことができます。
分析は、プロジェクトマネージャーまたは管理者によって作成されることがあります。言語学者は、自分自身の分析を実行することは許可されていません。ベンダーは、共有の仕事/プロジェクトのために分析を作成することができます。
一部のCATツールでは、分析を統計と呼びます。
組織の分析は、分析ダッシュボードによって提供されます。
異なる国で異なる請求単位が使用されるため、3つの計算方法が利用可能です:
-
文字数
スペースを除く。
-
単語数
単語の間にスペースを使用する言語の場合—中国語、日本語、タイ語を除く。
-
ページ数
スペースを含む1800文字—ファイル内の実際のページ数とは無関係です。
異なる言語間での異なるカウント方法により、提示されたワードカウントは他のアプリケーションによって生成されたワードカウントと同じではない場合があります。
分析のためのワードカウントは、MTU計算のそれとは異なります。
-
各結合タグは1つのスペースに置き換えられます。
-
他のタグは削除されます。
単語を区切るためにホワイトスペースを使用する言語(例:英語)では:
-
+-,.を含む各数字のシーケンスは1文字に置き換えられます(正規表現式[+-]?[0-9]+([., -]?[0-9]++)*+を使用)。 -
各ホワイトスペースのシーケンスは1つのスペースに置き換えられます。
-
セグメントの先頭と末尾のホワイトスペースは削除されます。
-
スペース以外の各文字のシーケンスは1つの単語としてカウントされます。
単語を区切るためにホワイトスペースを使用しない言語(例:日本語)では:
-
いくつかの句読点はテキストから削除されます(正規表現式
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]を使用)。 -
セグメントは、ホワイトスペース(NWS)に属する漢字、ひらがな、カタカナ、タイ文字の文字のシーケンスと、これらのスクリプトに属さない文字のシーケンス(WS)に分割されます。
-
単語の総数 = (NWSからの単語数) + (WSからの単語数)。
-
WSからの単語数は英語と同様に計算されます。
-
NWSの単語数はホワイトスペースを除いた文字数です。
-
タイ語の場合、単語数はホワイトスペースを除いた文字数を2で割ったものです。
備考
CJK言語の文字は、文字と単語の両方としてカウントされます。
分析を作成するには、次の手順に従ってください。
-
ページから、1つ以上のを選択します。
-
解析するをクリックします。
ウィンドウが開きます。
-
ドロップダウンリストからを選択します。
-
必要に応じて名前を提供します。
-
分析名のための利用可能なマクロ:
-
{projectName} -
{sourceLang}ソース言語を追加します。
-
{targetLang}ターゲット言語を追加します。複数の言語が分析される場合、言語は空欄になります。
-
{userName}割り当てられたリンギストまたはベンダーのユーザー名を追加します。複数のリンギストが割り当てられている場合、名前は空欄になります。
-
{workflow} -
{innerId} -
{fileName}分析に使用されるファイル/ジョブが多い場合、
{fileName}は空欄になります。
-
-
-
分析オプションを選択します。特に:
-
オプションを適用すると、数字が単語として計算されないため、ワードカウントに影響します。
-
オプションは、TMと比較するのではなく、分析されたジョブ内のセグメントの類似性を比較します。
がチェックされている場合、内部ファジーの一致は新しく作成された分析の別のカテゴリとして表示されます。以下に例を挙げます。
10の原文ワードを含む翻訳ジョブには、最後の文字だけが異なる以下のセグメントが含まれます:
-
私は新しい車を買いました。
-
私は新しい車を買いました!
TMに一致するものが見つからない場合、デフォルト解析が表示されます:
IFオプション
TMカテゴリ:0%-49%
TMカテゴリ:95%-99%
IFカテゴリ:95%-99%
IFを含める 無効
10ワード
IFを含める 有効 + IFを分ける 無効
5ワード
5ワード
IFを含める + IFを分ける 有効
5ワード
5ワード
-
-
-
解析するをクリックします。
解析、または解析結果は一覧に追加されます。
-
一覧の解析をクリックすると、詳細ページで表示するか、プロジェクト管理アプリケーションでレンダリングするためにダウンロードできます。
備考
解析オプションは、解析を作成する際、プロジェクトレベルで、または設定の下でグローバルに設定できます 。
3つの解析タイプが提供されています:
デフォルト解析は、原文セグメントの翻訳前に対して実行される標準解析です。これは、ポストエディット分析と組み合わせて、そのジョブの翻訳にどれだけの労力がかかったかを判断するために使用できるジョブの基準分析を提供します。この基準は、クライアントへの見積もりを生成するための基盤としても使用されます。
デフォルトでは、事前翻訳で設定されたTM閾値が使用されますが、必要に応じて変更できます。
セグメント/単語/文字数の内訳が生成され、プロジェクトで使用される場合、TM一致が特定され、翻訳不要箇所、内部のあいまい一致、及びQPS(有効な場合)が識別されます。
重要
翻訳後にデフォルトの分析を実行すると、不正確な分析が生成されます。
ポストエディット分析はターゲットセグメントに対して実行され、編集の労力を示します。つまり、テキストがリンギストまたは校正者からどれだけの編集を必要としたかを示します。ポストエディットが完了した後に実行されます。
リンギストが未翻訳のセグメントをクリックすると、そのセグメントのために現在の最高の翻訳メモリ一致、機械翻訳の提案、および/または翻訳不要が保存され、ポストエディット分析に使用されます。
ポストエディット分析は、任意のワークフローステップから起動でき、利用可能なソース(例:TM/MT)から挿入されたテキストとセグメントターゲットのポストエディット結果との間の差として計算されます。
ポストエディット分析は、従来の翻訳メモリ分析を拡張し、機械翻訳(MT)と翻訳不要箇所(NT)を含めます。サードパーティのMTエンジンもサポートされています。
重要
およびを無効にしても、分析からTM/MT一致が除外されることはありません。この場合、分析はポストエディットの労力ではなく、利用可能な高い一致のスコアを考慮します。
ポストエディット分析における101%のTM結果は、そのセグメントがTMから翻訳されたことを必ずしも意味するわけではありません。
例
MTを使用して翻訳されたジョブは、が無効になっている場合でも、101%のTMとして表示されることがあります。これは、セグメントが開かれたときに101%のTM一致が利用可能であった場合です。
ポスト分析オプション
ポストエディットオプションは、翻訳メモリ(TM)、翻訳不要箇所(NT)、および機械翻訳(MT)からの一致に必要なポストエディットの労力を計算するために使用されます。
解析 TM ポストエディット有効
-
低品質のTMで、高い一致率を持ち、リンギストによる編集が必要なものを対象としています。
-
TMのポストエディットの努力を示します。
-
分析には100%の一致のみが含まれています。TMからの文脈内101%の一致は計算に影響を与えません。
解析 TM ポストエディット無効
-
コストを削減するために、できるだけ編集を少なくする必要がある高品質のTMを対象としています。
-
101%と100%の両方を示します。
-
セグメントが開かれたときにリンギストに提供されるTMの一致を示します(実際のリンギストのポストエディットの努力ではありません)。
-
機械翻訳と非翻訳可能なもののポストエディットの努力を示します。
解析 NT/MT ポストエディット有効
-
MTまたはNTの提案がさらなる編集なしに受け入れられた場合、分析では100%の一致として表示されます。
-
リンギストがMTを変更した場合、一致率は低くなります。スコアカウントアルゴリズムは、翻訳メモリのあいまい一致のスコアを計算するために使用されるものと同じです。
-
NTの編集は、セグメントが0-49%のNTとして表示される原因となります。
解析 NT/MT ポストエディット無効
-
推定スコアがないMT/NTからのエントリは、TMの0%-49%の一致と見なされます。それらは、MTが考慮されずにリンギストによって翻訳されたことを示します。
-
QPSおよびPhrase Language AIの一致が75%を超える場合、それぞれの一致のMT列に表示されます。
-
セグメントが開かれたときにリンギストに提供されるNT/MTの一致を示します(実際のリンギストのポストエディットの努力ではありません)。
ソースの更新前にポストエディット解析を自動生成する
-
解析が作成されます:
-
更新されたジョブごとに。
-
各プロバイダに個別に割り当てられた個々のプロバイダごとに。
-
-
解析は次の場合には作成されません:
-
リンギストまたはベンダーが割り当てられていない。
-
-
解析は確認済みおよび翻訳済みセグメントをカウントします。
-
解析は命名規則に従います:
-
UpdateSource #{innerID}{workflow}
-
-
解析はカウントされたユニット(ソース)、NTポストエディットを解析する、TMポストエディットを解析する、MTポストエディットを解析するが選択された状態で作成されます。
のユニットをカウントする
-
解析に表示されるワードカウントを選択してください。ターゲットワードカウントはソースワードカウントよりも高くなる場合があります。
一致スコアには影響しません。
比較解析機能は、ワークフローステップを持つプロジェクトでのみ利用可能です。異なるワークフローステップのファイルの2つのバージョンをセグメントレベルで比較し、2つのバージョンの違いを分析します。分析に特定のプロジェクト設定がない場合、デフォルト設定が使用され、不正確なレポートが生成される可能性があります。
例
分析は複数のジョブで実行でき、2つの方法でグループ化できます:
-
プロバイダによる分析
-
さまざまな言語学者やベンダーに割り当てられた多くのジョブを持つプロジェクトの場合。使用目的:
-
個々の言語学者やベンダーに割り当てられたファイルを含む別々の分析を作成します。
-
分析をプロバイダに割り当て、分析をその言語学者/ベンダーに表示可能にします。
プロバイダに適用されている場合、課金率ルールがオプションとして事前に選択されます。
-
-
-
言語による分析
分析のためのソースファイルが更新されると、分析テーブルで古くなったものとしてマークされます。
再計算は、元の分析に使用された設定を適用します。
ベンダーは、バイヤーによって作成された分析を再計算することはできません。
新しいソースファイルを使用して再計算するには、次の手順に従ってください:
分析ビューをカスタマイズします。
、、、、およびの列は、分析テーブルで表示/非表示にできます。の列は、ポストエディット分析にも利用可能で、セグメントの編集にかかった秒数を示します。
分析をダウンロードします。
分析をダウンロードするには、次の手順に従ってください:
-
ダウンロードをクリックしてドロップダウンメニューを表示し、選択します:
-
CSV(カンマ区切り値)、文字の有無にかかわらず、スプレッドシートアプリケーションで読み取れます。
-
LOG(SDL Trados形式に似ている)で、ほとんどのプロジェクト管理アプリケーションで読み取れます。
-
JSON(JavaScriptオブジェクト表記)、軽量のデータ交換形式です。
JSON形式でダウンロードされた分析のみが、マッチタイプごとのNT、MT、TMおよび内部ファジー(IF)データの内訳を含みます。
-
-
ファイルタイプを選択すると、ダウンロードが開始されます。
これらのファイルは、ほとんどのプロジェクト管理ソフトウェアシステムにインポートできます。
課金率ルールを適用します。
分析において、単語/文字/ページに割引を適用できます。割引された翻訳ボリュームは、行の分析に即座に計算され、表示されます。
分析からネットレートルールを削除するには、ボタンの隣のフィールドを空欄のままにします。
ネットレートルールが分析に適用されると、ダウンロードされた分析ファイルには、各一致カテゴリの加重単語数が表示されます。
分析をプロバイダに割り当てるには、次の手順に従ってください:
-
一覧から分析を選択し、編集をクリックします。
編集ページが開きます。
-
ドロップダウンリストからプロバイダを選択します。
-
保存をクリックします。
分析は、リンギストポータルで割り当てられたプロバイダに利用可能になります。