解析は、選択したファイルの文字数と単語数を計算し、単語ごとの平均文字数、繰り返し、翻訳不要箇所、翻訳メモリ一致、内部あいまい一致、機械翻訳候補を特定します。解析では、レビュワーによる修正の数を表示することもできます。
解析はプロジェクトマネージャまたは管理者が作成できます。リンギストに独自の解析を実行させることはできません。ベンダーは共有ジョブ/プロジェクトの解析を作成できます。
CATツールの中には、解析を統計と呼ぶものもあります。
組織分析はAnalyticsダッシュボードで行います。
国によって異なる請求単位が使用されるため、3つの計算方法があります。
-
文字
スペースなし。
-
ワード数
単語間にスペースを使用する言語用(中国語、日本語、タイ語を除く)。
-
ページ
1800 文字(スペース含む)。ファイルの実際のページ数とは無関係です。
言語によってカウント方法が異なるため、表示されるワードカウントは、他のアプリケーションが生成したワードカウントと同じではない可能性があります。
-
各結合タグは 1 つのスペースに置き換えられます。
-
他のtagsは削除されます。
単語の区切りにスペースを使用している言語(英語など):
-
+-,.
を含む各数字列は 1 文字に置き換えられます(正規表現[+-]
?[0-9]+([., -]?[0-9]++)*+ を使用)。 -
一連の空白は、それぞれ 1 つのスペースに置き換えられます。
-
セグメントの最初と最後の空白は削除されます。
-
スペース以外の文字の連続は1ワードとしてカウントされます。
単語の区切りに空白文字を使用していない言語(日本語など):
-
一部の句読点がテキストから削除されます(正規表現
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]
)。 -
セグメントは、非ホワイトスペース(NWS)漢字、ひらがな、カタカナ、タイ文字に属する文字のシーケンスと、これらの文字に属さない文字のシーケンス(WS)に分割。
-
総ワード数 = (NWSのワード数) + (WSのワード数)。
-
WSからの単語数は英語と同様に計算されます。
-
NWSのワード数は、スペースを含まない文字数です。
備考
日中韓の言語の文字は、文字と単語の両方としてカウントされます。
解析を作成するには、次の手順に従います。
-
ページで、1 つまたは複数の を選択します。
-
解析するをクリックします。
ウィンドウが開きます。
-
ドロップダウンリストから
を選択します。 -
必要に応じて名前を入力します。
-
解析命名に使用可能なマクロ:
-
{projectName}
-
{sourceLang}
原文言語を追加する
-
{targetLang}
訳文言語を追加する複数言語が解析される場合、その言語は empty になります。
-
{userName}
割り当て済リンギストまたはベンダーのユーザー名を追加します。複数のリンギストが割り当てられている場合、名前は empty になります。
-
{ワークフロー}
-
{innerId}
-
{fileName}
さらに多くのファイル/ジョブが解析に使用される場合、
{fileName}
はemptyになります。
-
-
-
解析オプション選択特に:
-
オプションを適用すると、数字はワード数として計算されないため、ワードカウントに影響します。
-
「
内部あいまい表現を含む) 」オプションは、解析ジョブ内のセグメントについて、TMとの比較のみではなく、ファイル内の類似点を比較します。一致を分離] をオンにすると、新しく作成された解析で内部あいまい一致が別のカテゴリとして表示されます。以下に例を挙げます。
原文10ワードの翻訳ジョブには、最後の文字のみが異なる次のセグメントが含まれます。
-
私は新車を買った。
-
新しい車を買いました!
TM で一致が見つからない場合、デフォルト解析が表示されます。
IFオプション
TMカテゴリ:0%-49%
TMカテゴリ:95%-99%
IFカテゴリー:95%-99%
IFを含めるが無効です
10ワード
Include IF enabled + Separate IF disabled
5ワード
5ワード
Include IF + Separate IF enabled
5ワード
5ワード
-
-
-
解析するをクリックします。
解析結果が一覧に追加されます。
-
一覧内の解析をクリックすると、簡単な表に表示したり、プロジェクト管理アプリケーションでレンダリングするためにダウンロードできます。
備考
解析オプションは、解析作成時に、プロジェクトレベルで、または設定でグローバルに設定できます。
3 つの解析タイプが用意されています。
ポストエディット解析は訳文セグメントに対して実行され、編集作業量、つまりリンギストまたはプルーフリーダーに必要なテキストの編集量が示されます。ポストエディットの完了後に実行されます。
リンギストが未翻訳のセグメントをクリックすると、その時点で最高の翻訳メモリ一致、機械翻訳候補、および/または翻訳不要箇所がそのセグメントに保存され、ポストエディット解析で使用されます。
ポストエディット解析は、任意のワークフローステップから開始することができ、利用可能な原文(TM/MTなど)から挿入されたテキストと、セグメント訳文内のポストエディット結果の差として計算されます。
ポストエディット解析は、従来の翻訳メモリ解析を拡張し、機械翻訳(MT)と翻訳不要箇所(NT)を含めます。サードパーティMTエンジンもサポートされています。
および 解析を無効にしても、TM/MT 一致は解析から除外されません。この場合、解析ではポストエディットではなく、使用可能な高い一致のスコアが考慮されます。
解析後オプション
ポストエディットオプションは、翻訳メモリ(TM)、翻訳不要箇所(NT)、および機械翻訳(MT)から、一致に必要なポストエディット労力を計算するために使用されます。
TMのポストエディットを解析する
-
リンギスト編集が必要な一致率が高い低品質のTMSを対象としています。
-
TM のポストエディット作業を示します。
-
解析に 100% 一致のみが含まれます。文書内一致 TM の 101% 一致は計算に影響しません。
TMのポスト エディットを解析する
-
コスト削減のために一致箇所をできるだけ少なく編集する必要がある、高品質のTMを対象としています。
-
101% と 100% の両方を示します。
-
セグメントが開かれたときにリンギストに提供された TM 一致を示します(実際のリンギストのポストエディット作業ではありません)。
-
機械翻訳および翻訳不要箇所に対するポストエディット作業を示します。
NT/MTポストエディットを解析する
-
MTまたはNTがそれ以上編集されずに受け入れられた場合、解析では100%一致として提示されます。
-
リンギストが MT を変更すると、一致率は低くなります。スコア計算アルゴリズムは、翻訳メモリあいまい一致のスコア計算と同じです。
-
NT を編集すると、セグメントは 0 ~ 49% の NT になります。
NT/MTポストエディットを解析する
-
推定スコアなしの MT/NT からのエントリは、TM 0% ~ 49% 一致と見なされます。MTが考慮されていないリンギストによって翻訳済として示されます。
-
QPS(品質評価スコア)と Phrase Language AI の一致が 75% 以上であれば、それぞれの一致の MT 列に表示されます。
-
セグメントが開かれたときにリンギストに提供された NT/MT 一致を示します(実際のリンギストのポストエディット作業ではありません)。
原文の更新前にポストエディット解析を自動生成する
-
解析が作成されました:
-
更新された各ジョブ。
-
個々のプロバイダ用に個別に作成され、各プロバイダに割り当て済。
-
-
以下の場合、解析は作成されません。
-
リンギストやベンダーが割り当てられていません。
-
-
解析カウント確定済および翻訳済セグメント。
-
解析は命名規則に従います。
-
UpdateSource #{innerID}{workflow}
-
-
解析は原文単位で作成され、NT ポストエディット解析し、TM ポストエディット解析し、MT ポストエディット解析します。
のカウント単位
-
解析に表示するワードカウントを選択します。訳文のワードカウントが原文のワードカウントより大きい場合があります。
一致スコアリングには影響しません。
比較解析機能は、ワークフローステップのあるプロジェクトでのみ使用できます。ワークフローステップが異なる2つのバージョンのファイルをセグメントレベルで比較し、2つのバージョンの違いを分析します。解析にプロジェクト固有の設定がない場合、デフォルト設定が使用され、誤ったレポートが作成される可能性があります。
例:
解析は複数のジョブに対して実行でき、2つの方法でグループ化できます。
-
プロバイダ別に解析する
-
多くのジョブがさまざまなリンギストまたはベンダーに割り当てられているプロジェクト用。用途:
-
個々のリンギストまたはベンダーに割り当てられたファイルを含む別の解析を作成。
-
プロバイダに解析を割り当て、プロバイダのリンギスト/ベンダーが解析結果を表示できるようにします。
課金率ルールがプロバイダに適用される場合、課金率ルールはオプションとして事前に選択されます。
-
-
-
言語別に解析する
解析に使用される原文ファイルが更新されると、解析テーブルで古いであることが示されます。
再計算を行うと、元の解析に使用した設定が適用されます。
ベンダーは、バイヤーが作成した解析を再計算することはできません。
新しい原文ファイルを使用して再計算するには、次の手順に従います。
解析ビューをカスタマイズする
解析テーブルには、
、 、 、 、 列の表示/非表示を設定できます。 列はポストエディット解析にも使用でき、セグメントの編集にかかった秒数を示します。解析をダウンロード
解析をダウンロードする手順は、次のとおりです。
-
ダウンロードをクリックしてドロップダウンメニューを表示し、以下を選択します。
-
文字の有無にかかわらず、スプレッドシートアプリケーションで読み取り可能なCSV(コンマ区切り値)。
-
ログ(SDL Tradosファイル形式に類似)ほとんどのプロジェクト管理アプリケーションで読み取り可能。
-
JSON(JavaScript Object Notation)。軽量なデータ交換ファイル形式。
JSONファイル形式でダウンロードされる解析にのみ、一致タイプごとのNT、MT、TM、および内部ファジー(IF)データの内訳が含まれます。
-
-
ファイルの種類を選択すると、ダウンロードが実行されます。
これらのファイルは、ほとんどのプロジェクト管理ソフトウェアシステムにインポートできます。
課金率ルールを適用する
解析では、ワード数/文字数/ページ数に対して割引を適用できます。割引後の翻訳量はすぐに計算され、解析の
行に直接表示されます。課金率ルールを解析から削除するには、
ボタンの隣のフィールドを empty のままにします。解析に課金率ルールが適用されると、解析とともにダウンロードしたファイルに、各一致カテゴリの重み付けされた単語数が表示されます。
解析をプロバイダに割り当てる手順は、次のとおりです。
-
一覧から解析を選択し、編集をクリックします。
編集ページが開きます。
-
ドロップ一覧からプロバイダを選択します。
-
保存をクリックします。
解析は、割り当て済のプロバイダがリンギスト Portal で利用できます。