分析ダッシュボードは、ナビゲーションパネルのフレーズ分析ボタンからアクセスされます。
-
プロバイダ別のプロバイダ別を示すチャートには、言語学者とベンダーの両方が含まれます。
-
言語ペアは、ソース言語からターゲット言語への連結として表示されます。
-
プロジェクト別のプロジェクト別を示すチャートは、最初の10,000プロジェクトのみを表示し、ダウンロード時には完全なプロジェクトリストが含まれます。
-
ダッシュボードはUTCタイムゾーンでデータを表示します。
-
ダッシュボードは1日2回更新されます:
-
EUインスタンスのための午前12時と午後12時UTC
-
USインスタンスのための午前7時と午後7時UTC
各ダッシュボードは、最後のデータ更新完了時刻を表示します。表示されるタイムスタンプには、最大3時間前に生成されたデータが含まれない場合があることに注意することが重要です。これは、データ更新プロセスがトリガーされたときに、トランザクションが時間内にキャプチャされない可能性があるためです。
-
-
データレポートは過去12ヶ月分利用可能で、ユーザーはいつでも1年間のデータを取得できます。
ダッシュボードのビデオレビュー:
プロジェクトマネージャーの役割が高度な分析チャートとダッシュボードを表示するためのアクセス権は、ユーザー設定で管理者によって設定できます。
すべてのダッシュボードは、選択したデータをチャートに表示するための異なるフィルタをサポートしています。特に、ジョブの状態フィルタは、次のジョブの状態を考慮します:
-
。
-
。
ジョブまたはプロジェクトが削除されると、ジョブはごみ箱にある限りこの状態でマークされます。
-
。
リサイクルビンを手動または自動で空にすることによって削除されたジョブ。
-
。
備考
ジョブがアーカイブされると、その状態はアーカイブ済みに変わります。プロジェクトがアーカイブされると、ジョブの状態は変わりません。
パフォーマンスが低下し、チャートが定義を保持できなくなる可能性があるため、日付フィルタは1年以上実行しないことをお勧めします。
すべてのチャートは、.csv、.xlsx、.json、.pngファイル形式でダウンロードできます。チャートの右上にある3点ボタンをクリックし、 結果をダウンロードを選択します:
-
大きな数値にカンマ区切りを含むフォーマットされた結果をダウンロードするには、
ウィンドウから希望のファイル形式を選択します。 -
フォーマットされていない結果をダウンロードするには、Shift(Windows)またはOption(Mac)キーを押しながら、 ウィンドウから希望のファイル形式を選択します。
共有コンテンツからのデータは、すべてのダッシュボードでサポートされています。
いくつかのダッシュボードには、組織が所有するデータと組織間で共有されるデータを区別するための所有権フィルタが含まれています:
-
フィルタは、組織がジョブの作成者であるかどうかを識別します。
-
組織によって作成されたジョブ(共有される場合もあれば、されない場合もあります)。
-
誰が作成したかに関係なく、組織と共有されているジョブ。
-
-
フィルタは、組織がLQA評価の作成者であるかどうかを識別します。
プロバイダが自分の組織からのものであるか、異なる組織からのものであるかは、 ダッシュボード内の共有コンテンツで識別されます:
-
ユーザーがあなたの組織からのものであれば、実際のユーザー名とフルネームが表示されます。
-
異なる組織のユーザーの場合、ユーザーIDと組織名はスコアカードに表示されます。
これは、品質ダッシュボードの次のプロバイダーフィールドに影響します:
-
translation_provider_username
-
translation_provider_full_name
-
-
フィルターは、組織が見積もりの作成者であるかどうかを識別します。
-
フィルターは、組織が分析の作成者であるかどうかを識別します。
チャートは、組織の実際の支出を価格指標(例:ワードカウント、文字数、ページ数または時間)で計算し、価格表で掛け算したものを示します。
コストダッシュボードは以下に基づいています:
-
プロジェクト内のすべてのワークフローステップの見積もり。
備考
同じワークフローステップの新しい見積もりを作成すると、以前に作成された見積もりのデータが上書きされます。
-
プロジェクトのすべての時間単位の見積もりと、各ジョブの標準見積もりの最新の見積もり。
共有プロジェクト(または割り当てられたプロバイダーのある見積もり)では、見積もりはすべてのユーザーに表示されますが、最新の見積もりは各ユーザーで異なる場合があります。
ジョブにプロバイダーを割り当てる際は、以下を考慮してください:
-
ジョブ作成中にプロバイダーが割り当てられた場合、その価格表はプロジェクトの価格表を上書きします。
-
後でプロバイダーが割り当てられた場合、コストは自動的に再計算されません。
データを適切に更新するために、割り当てられたユーザーのために見積もりを生成します。
-
ジョブの一部に複数のプロバイダーが割り当てられている場合、最初にリストされたプロバイダーのデータが使用されます。
他のユーザーの価格情報を使用するために新しい見積もりを生成します。
チャートは、翻訳メモリ(TM)、機械翻訳(MT)、繰り返し、非翻訳可能(NT)がジョブ全体でどのように活用されているかを示します。
活用は、ネットレートスキームを適用する前の特定の一致カテゴリのワードカウントと、ネットレートスキームを適用した後の同じ一致カテゴリのワードカウントの差として計算されます。
ダッシュボードは次の内容に基づいています:
-
デフォルトの解析からのデータ。
-
特定のジョブに対する最後の実行解析からのデータ。
データは、分析が作成される前に、プロジェクトまたはジョブに割り当てられたプロバイダに課金率ルールが追加されたときのみ生成されます。プロジェクトまたは分析で課金率ルールが変更されると、分析は最新の情報を表示します。
次のシナリオでは、チャートはデータを表示しません:
-
課金率ルールのないプロジェクトとジョブ。
-
0のレバレッジを持つ分析(例:プロジェクト、言語ペアなど)。
-
内部ファジーを持つ分析。
-
削除された分析。
ダッシュボードの計算には、視聴者の組織に属するユーザーによって作成された分析のみが含まれます。したがって、バイヤーがベンダーとジョブを共有し、ベンダーが分析を作成すると:
-
バイヤーはダッシュボードで分析に関連するデータを見ません。
-
ベンダーが分析の作成者であるため、彼らはダッシュボードで関連データを見ることができます。
品質パフォーマンススコアは、セグメントレベルでMT翻訳の品質を評価し、どのセグメントが自動確認に十分良いかを判断します。これにより、組織は低品質の翻訳を自動的に検出し、完全な人間のレビューの必要性を減らすことができます。
事前翻訳済みセグメントは、事前翻訳設定で設定されたQPSの閾値に基づいて自動的に確認できます。QPSは、Language AIを介して翻訳されたMTセグメントにのみ利用可能です。
ダッシュボードは、コスト削減と品質リスクのバランスを取るための最適なQPS閾値を見つけるのに役立ちます。
ダッシュボードのフィルターは、技術的、法的、マーケティングのテキストが異なる品質要件を持つ可能性があるため、さまざまなコンテンツカテゴリの最適な値を見つけるのに役立ちます。
これらの洞察は、セグメントレベルのメトリックに基づいています。カスタムインサイトは、Phrase Data Premiumを使用することで解除され、セグメントレベルの生データにアクセスできます。
含まれるデータ
-
2025年1月1日から始まる過去6ヶ月(追跡が始まった時)
-
QPSはMT翻訳にのみ利用可能で、Language AIを介して処理されたもののみです。
-
すべてのLanguage AIセグメントは、ソースに関係なく(翻訳前またはエディタの提案)表示されます。
-
QPSスコアは、言語AIを介して翻訳された後に与えられた元のスコアであり、リンギストによる編集後のものではありません。
-
バイヤー(ベンダーではない)は、共有プロジェクトのデータを確認します。
長い編集時間のフィルタリング
時折、セグメントの編集時間が異常に長くなることがあります。これは、気が散ること(例:電話をチェックしたり、休憩を取ったりすること)による可能性があります。データの正確性を維持するために、平均編集時間は約20秒です。50%のバッファが適用され、編集時間が30秒を超えるセグメントは除外されます。
長い編集が正当である場合もありますが、ほとんどは外れ値であり、ノイズを引き起こします。
フィルタリングの影響:
-
大規模なデータセットでは、これらの長いセグメントをフィルタリングしても影響は最小限です。
-
小規模なデータセットでは、単一の長時間の編集が総編集時間に不均衡に影響を与えるため、効果がより顕著です。
このフィルタリングにより、よりクリーンで信頼性の高い時間追跡データが確保されます。
チャートの説明
-
チャート 1:
選択した期間内の QPS スコアに基づくセグメントボリュームの分布を表示します。
-
チャート 2:
言語学者によって編集されたセグメントの割合を示します。高い QPS スコアは、編集が少ないことが期待されます。
-
チャート 3:
言語学者がセグメントを編集するのにかかる時間を示します。
-
チャート 4:
編集されたセグメントと未編集のセグメント(編集時間が 0 のセグメント)の両方を含みます。これは、前の 2 つのチャートからの洞察を組み合わせて、処理されたすべてのセグメントに費やされた全体的な努力のより明確なイメージを提供します。
-
チャート 5:
QPS の閾値が下がった場合に人間の確認を必要としない自動承認された単語の数を推定します。例えば、QPS の閾値が 95 から 90 に下がると、平均自動承認単語数が 950 から 1,750 に増加する可能性があります。
-
チャート 6:
QPSの閾値が下げられた場合に節約できる編集時間を示します。
-
チャート7:
自動確認されたセグメントと編集されたMTセグメントの割合を比較することで、編集されたセグメントの減少を追跡します。
ダッシュボードはLQA機能に焦点を当て、完了した評価の結果を独自の行で表示します。評価結果には問題が含まれる場合と含まれない場合があり、チャートはジョブ作成日を基にしています。
ダッシュボードは以下の洞察を提供します:
-
組織全体の平均品質スコアと時間の経過に伴うエラーの数。
-
どのカテゴリに最も重度のLQAエラーがあるか。
-
どのプロバイダが高い品質スコアを維持しているか。
-
各プロジェクトの重度別エラー数。
-
言語ペアとクライアントごとの品質スコアの推移。
LQAエラーのカウントには繰り返しの問題が含まれます。繰り返しの問題と非繰り返しの問題は、プロジェクト別およびプロバイダ別のテーブルで別々に表示されます。
LQAと自動LQAの洞察の間にトグルがあります。
ダッシュボードは、ジョブの支払いに関するベンダーの見積もり情報を表示し、新規、承認済み、承認待ち、却下されたステータスのすべての見積もりを含みます。
削除されたプロジェクトの見積もりはダッシュボードから除外されます。
-
は、見積もり内のすべてのジョブに設定された最低価格です。
-
は、見積もり内の各ジョブにかかる価格です。
-
は、すべてのジョブのワークフローステップ、言語ペアなどの間で均等に分割された実際に支払われたコストを示します。
このダッシュボードは、見積もりからの生の価格とネット価格を比較して、関連する節約を計算します。
最低価格が計算された価格よりも高い場合、見積もりには最低価格が使用されます。この場合、節約はゼロとなります。なぜなら、課金率ルールは最低価格には関連しないからです。
最低料金が存在する場合、ワードカウントの計算は適用されなくなります。
備考
従来の
ダッシュボードでは、最低価格が0の場合、節約は生の価格とネット価格の差として考慮されます。このダッシュボードは、作成されたジョブの日付とジョブの期限日を基に、時間通りのジョブ配信と期限切れのジョブ配信に焦点を当てています。キャンセル、拒否、またはリンギストによって拒否されたでないすべての時間通りのジョブと期限切れのジョブが含まれます。
ダッシュボードには、期限があり、最後のステータスがジョブがまだ完了としてマークされていない場合、ジョブの期限日は現在の日付と比較されます。
このダッシュボードでデータを視覚化するための2つの前提条件があります:
-
ジョブには期限日が必要です。
-
チャートを除いて、ジョブは正しいステータスの順序 - 新規、メール送信、受け入れ、完了 - に従う必要があります:
-
ジョブがメール送信された日時は、プロバイダによって受け入れられたジョブの日時以下または等しいです。
-
プロバイダによって受け入れられたジョブの日時は、プロバイダによって配信されたジョブまたは完了したジョブの日時以下または等しいです。
-
ジョブは同じステータスを複数回通過する可能性があるため、計算は最初の割り当てのインスタンスと最後の受け入れおよび完了のインスタンスに基づいています。
備考
すべてのジョブワークフローステップは、翻訳ステップと改訂ステップがある場合、それぞれは別々のステータスでカウントされます(異なる場合もあります)。
チャートにカウントされます。たとえば、ジョブにダッシュボードは以下の情報を提供します:
-
時間通りと期限切れのジョブの数。
-
メタデータに基づくジョブ配信の追跡 - すなわち、クライアントとドメイン。
-
どのプロジェクトが順調で、どれがそうでないか。
-
どのクライアントとプロバイダーが良好なパフォーマンスを示しているか。
-
ジョブが割り当てられ、受け入れられ、完了するまでの平均時間を言語ペアごとに分割。これにより、各状態で通常どの言語がより多くまたは少ない時間を要するかが理解できます。
-
ワークフローステップごとの平均編集時間。
フレーズデータを使用している場合、ステータス名は異なり、次のように相関します:
以下の基準がデータに適用されます:
-
TMまたはMTによって事前翻訳されたセグメントが含まれます。
-
複数のジョブパーツを持つセグメントは、1つのセグメントとして考慮され、カウントされます。編集時間の合計は、すべてのジョブパーツにわたるセグメントから取得されます。
-
編集時間が30秒を超えるセグメントは、編集時間の平均には含まれませんが、事前翻訳されたセグメントのチャートのカウントには含まれます。
-
すべてのジョブパーツが一度は
または されたジョブからのセグメントが含まれます。 -
前の6カレンダー月および現在の月に作成されたセグメントが含まれます。
チャートは次のことを強調します:
-
このチャートは、事前翻訳されたセグメントの平均編集時間を示しています。TMによって事前翻訳されたセグメントの場合、TMマッチカテゴリスコアによる編集時間を示します。MTによって事前翻訳されたセグメントの場合、横線はMTセグメントの平均編集時間を示します。これにより、閾値を設定するための最適な値を示すのに役立つはずです。
-
編集されていないセグメントは、0の編集時間で含まれます。
-
TMマッチスコアは、データをより良く提示するためにカテゴリ(0-69%、70-74%、...、95-99%、100-101%)にグループ化されます。
-
-
このチャートは、すべてのソースからの事前翻訳されたセグメントの全体的な平均編集時間を示しています。これは、閾値の変更が影響を与えるかどうかを確認するために使用できます。閾値の値を調整することで、編集時間が短くなるはずです。
-
このチャートは、事前翻訳を通過しているセグメントの数とTMによって返されたマッチカテゴリスコアを示しています。
フィルターには次が含まれます:
-
日付 - セグメントが作成された日付です。
-
デフォルトで6ヶ月に設定されており、フレーズTM閾値の値推奨に使用される基準と一致します。
-
-
プロジェクトテンプレート
-
ドメイン (プロジェクトメタデータ)
-
サブドメイン (プロジェクトメタデータ)
-
ターゲットロケール (プロジェクトメタデータ)
これらのチャートは、最適なTM閾値を特定することによって言語的努力を最小限に抑えるための洞察を提供し、自動化を活用するための出発点として機能するべきです。いくつかのフィルターの組み合わせを設定すると、十分なデータが含まれていない小さなセグメントのサブセットが表示される可能性があります。
ワードカウントは、TMSで処理されたすべてのソースワード(アップロードされた)を考慮に入れます。これは、提出が行われたとき、ジョブが作成されたとき、または継続的なローカライズとソースの更新が行われたときに該当します。ダッシュボードフィルターを調整して、削除されたジョブやゴミ箱に入れられたジョブを含めます。継続的なジョブでは、計算は最新バージョンのすべてのソースワードに基づいています。
ダッシュボードは、処理されたワードカウントに関する洞察を提供します:
-
サブスクリプション中に使用された単語。
-
月ごとの単語消費。
-
プロバイダー間での単語の分配。
-
どの言語ペアが最も多くの単語ボリュームを占めているか。
-
クライアントやドメインなどのメタデータによる単語ボリュームの分割。
プロジェクト作成者またはジョブ作成者によるワードカウントは、高度な分析で利用可能なカスタマイズ可能なチャートを通じて表示できます。
必要に応じて、ワードカウントの代わりに文字または カウントに基づくチャートを表示することが可能です。 トグルを通じて希望するメトリックを選択し、チャートに関連データを表示します。
異なる言語間での異なるカウント方法のため、提示されたワードカウントは他のアプリケーションによって生成されたワードカウントと同じではない場合があります。
分析のワードカウントはMTU計算のそれとは異なります。
-
各結合タグは1つのスペースに置き換えられます。
-
他のタグは削除されます。
単語を区切るためにホワイトスペースを使用する言語では(例:英語):
-
+-,.
を含む各数字のシーケンスは1文字に置き換えられます(正規表現式[+-]?[0-9]+([., -]?[0-9]++)*+
を使用)。 -
各ホワイトスペースのシーケンスは1つのスペースに置き換えられます。
-
セグメントの先頭と末尾のホワイトスペースは削除されます。
-
スペース以外の各文字のシーケンスは1つのワードとしてカウントされます。
単語を区切るためにホワイトスペースを使用しない言語では(例:日本語):
-
いくつかの句読点はテキストから削除されます(正規表現式
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]
を使用)。 -
セグメントは、ホワイトスペース(NWS)に属する漢字、ひらがな、カタカナ、タイ文字の文字のシーケンスと、これらのスクリプトに属さない文字のシーケンス(WS)に分割されます。
-
ワードの総数 = (NWSからのワード数) + (WSからのワード数)。
-
WSからのワード数は英語と同様に計算されます。
-
NWSのワード数はホワイトスペースのない文字数です。
他のダッシュボードの基準が必要な場合は、機能リクエストを歓迎します。