分析ダッシュボードは、ナビゲーションパネルのPhrase Analyticsボタンからアクセスされます。
内部のデータストレージポリシーに従い、完全に削除されたコンテンツからの顧客入力テキスト(例:プロジェクト名、ファイル名、ドメイン)はPhrase Analyticsに表示されません。完全に削除されたコンテンツは削除済みに置き換えられます。完全に削除されたコンテンツからのすべての数値、日付、タイムスタンプ、ブールデータ型は引き続き利用可能です。これにより、歴史的なKPI、トレンド、予測集計が時間の経過とともに一貫性を保つことができます。
-
プロバイダ別を示すチャートには、言語学者とベンダーの両方が含まれます。
-
言語ペアは、ソース言語からターゲット言語への連結として表示されます。
-
プロジェクト別を示すチャートは、最初の10,000プロジェクトのみを表示し、ダウンロード時には完全なプロジェクトリストが含まれます。
-
ダッシュボードはUTCタイムゾーンでデータを表示します。
-
ダッシュボードは1日2回更新されます:
-
EUインスタンスのための午前12時と午後12時UTC
-
USインスタンスのための午前7時と午後7時UTC
各ダッシュボードは、最後のデータ更新完了時刻を表示します。表示されるタイムスタンプには、最大3時間前に生成されたデータが含まれない可能性があることに注意することが重要です。これは、データ更新プロセスがトリガーされたときにトランザクションが時間内にキャプチャされない可能性があるためです。
-
-
データレポートは過去12ヶ月分利用可能で、ユーザーはいつでも1年間のデータを取得できます。
ダッシュボードのビデオレビュー:
プロジェクトマネージャーの役割に対するアクセス権は、ユーザー 設定で管理者によって設定できます。
すべてのダッシュボードは、選択したデータをチャートに表示するための異なるフィルタをサポートしています。特に、ジョブの状態 フィルタは、以下のジョブの状態を考慮します:
-
。
-
。
ジョブまたはプロジェクトが削除されると、そのジョブはごみ箱にある限りこの状態でマークされます。
-
。
手動または自動でごみ箱を空にすることによって削除されたジョブ。
-
。
備考
ジョブがアーカイブされると、その状態は アーカイブ済み に変更されます。プロジェクトがアーカイブされると、ジョブの状態は変更されません。
パフォーマンスが低下し、チャートが定義を保持できなくなる可能性があるため、日付フィルタは1年以上の期間で実行しないことをお勧めします。
すべてのチャートは、.csv、.xlsx、.json、.png のファイル形式でダウンロードできます。チャートの右上にある3点ボタンをクリックし、 結果をダウンロード を選択します:
-
大きな数値にカンマ区切りを含むフォーマットされた結果をダウンロードするには、 ウィンドウから希望のファイル形式を選択します。
-
フォーマットされていない結果をダウンロードするには、Shift (Windows) または Option (Mac) キーを押しながら、 ウィンドウから希望のファイル形式を選択します。
共有 コンテンツからのデータは、すべてのダッシュボードでサポートされています。
いくつかのダッシュボードには、組織が所有するデータと組織間で共有されるデータを区別するのに役立つ所有権フィルタが含まれています:
-
フィルタは、組織がジョブの作成者であるかどうかを識別します。
-
組織によって作成されたジョブ(共有されている場合もあれば、されていない場合もあります)。
-
組織と共有されている、または組織によって共有されているジョブで、誰が作成したかは関係ありません。
-
-
フィルタは、組織がLQA評価の作成者であるかどうかを識別します。
レビュー提供者は所有者と見なされるため、組織のビューには評価がとして表示されます。他の組織のユーザー(翻訳提供者、プロジェクトバイヤー、またはベンダーなど)は、同じ評価がの下にリストされているのを見ます。
提供者があなたの組織からの場合、彼らのユーザー名とフルネームが表示されます。提供者が異なる組織からの場合、彼らのユーザーIDと組織名がスコアカードに表示されます。
-
フィルタは、組織が見積もりの作成者であるかどうかを識別します。
-
フィルタは、組織が解析の作成者であるかどうかを識別します。
チャートは、組織の実際の支出を価格指標(例:ワードカウント、文字カウント、ページ数または時間)で計算し、価格表で掛け算したものを示します。
コストダッシュボードは以下に基づいています:
-
見積もりプロジェクト内のすべてのワークフローステップのために。
備考
同じワークフローステップの新しい見積もりを作成すると、以前に作成された見積もりのデータが上書きされます。
-
すべてのプロジェクトの時間単位の見積もりと各ジョブの標準見積もりの最新の見積もり。
共有プロジェクト(または割り当てられたプロバイダの見積もり)では、見積もりはすべてのユーザーに表示されますが、最新の見積もりは各ユーザーによって異なる場合があります。
ジョブにプロバイダを割り当てる際は、次の点を考慮してください:
-
ジョブ作成時にプロバイダが割り当てられた場合、その価格表はプロジェクトの価格表を上書きします。
-
後でプロバイダが割り当てられた場合、コストは自動的に再計算されません。
割り当てられたユーザーのために見積もりを生成して、データを適切に更新します。
-
ジョブの一部に複数のプロバイダが割り当てられている場合、最初にリストされたプロバイダのデータが使用されます。
他のユーザーの価格情報を使用するために新しい見積もりを生成します。
タブは、Phrase TMSおよびStrings、Phrase Portal、およびAPI経由のPhrase Language AIにおけるMTユニットと翻訳された文字の消費に関する洞察を提供します。プロジェクトおよびワークフローステップごとに、時間の経過、ロケールペア、MTエンジン、MTプロファイルに関する消費の概要を提供します。
アクセス時にはPhrase TMSがデフォルトですが、ユーザーはPhrase製品ダッシュボードフィルタを調整することで、すべての/特定のPhrase製品にわたる消費も確認できます。
TMS MT起源フィルタは、Phrase TMS全体のMTユニットの分割を示します:
-
TMS事前翻訳
-
TMS解析
-
TMS CATエディタ
チャートは、翻訳メモリ(TM)、機械翻訳(MT)、繰り返し、非翻訳可能(NT)がジョブ全体でどのように活用されているかを表示します。
活用は、ネットレートスキームを適用する前の特定の一致カテゴリのワードカウントと、ネットレートスキームを適用した後の同じ一致カテゴリのワードカウントの差として計算されます。
ダッシュボードは次の基にしています:
-
デフォルトの分析からのデータ。
-
任意のジョブの最後の実行分析からのデータ。
データは、分析が作成される前に、プロジェクトまたはジョブに割り当てられたプロバイダに課金率ルールが追加されたときのみ生成されます。プロジェクトまたは分析で課金率ルールが変更されると、分析は最新の情報を表示します。
チャートは、以下のシナリオではデータを表示しません:
-
課金率ルールのないプロジェクトとジョブ。
-
0のレバレッジを持つ分析(例:プロジェクト、言語ペアなど)。
-
内部ファジーを持つ分析。
-
削除された分析。
ダッシュボードの計算には、ビューアの組織に属するユーザーによって作成された分析のみが含まれます。したがって、バイヤーがベンダーとジョブを共有すると、ベンダーが分析を作成します:
-
バイヤーはダッシュボードで分析に関連するデータを表示しません。
-
ベンダーが分析の作成者であるため、彼らはダッシュボードで関連データを見ることができます。
品質パフォーマンススコアは、セグメントレベルでMT翻訳の品質を評価し、どのセグメントが自動確認に十分であるかを判断します。これにより、組織は低品質の翻訳を自動的に検出し、完全な人間のレビューの必要性を減らすことができます。
事前翻訳されたセグメントは、事前翻訳設定で設定されたQPSの閾値に基づいて自動的に確認できます。QPSは、Language AIを介して翻訳されたMTセグメントにのみ利用可能です。
ダッシュボードは、コスト削減と品質リスクのバランスを取るための最適なQPS閾値を見つけるのに役立ちます。
ダッシュボードのフィルターは、技術的、法的、マーケティングのテキストが異なる品質要件を持つ可能性があるため、さまざまなコンテンツカテゴリの最適な値を見つけるのに役立ちます。
これらの洞察は、セグメントレベルのメトリクスに基づいています。カスタムインサイトは、Phrase Data Premiumを使用することでアンロックされ、セグメントレベルの生データにアクセスできます。
含まれるデータ
-
2025年1月1日から始まる過去6ヶ月(追跡が始まった時)
-
QPSはMT翻訳にのみ利用可能で、Language AIを介して処理されたものに限ります。
-
すべてのLanguage AIセグメントは、ソースに関係なく(翻訳前またはエディタの提案)含まれます。
-
QPSスコアは、言語AIを介して翻訳された後に与えられた元のスコアであり、リンギストによる編集後のものではありません。
-
バイヤー(ベンダーではなく)は、共有プロジェクトのデータを確認します。
長い編集時間のフィルタリング
時折、セグメントの編集時間が異常に長くなることがあります。これは、気が散ること(例:電話をチェックしたり、休憩を取ったりすること)による可能性があります。データの正確性を維持するために、平均編集時間は約20秒です。50%のバッファが適用され、編集時間が30秒を超えるセグメントは除外されます。
長い編集が正当な場合もありますが、大部分は外れ値であり、ノイズを引き起こします。
フィルタリングの影響:
-
大規模なデータセットでは、これらの長いセグメントをフィルタリングしても影響は最小限です。
-
小規模なデータセットでは、単一の長時間の編集が総編集時間に不均衡に影響を与えるため、効果がより顕著です。
このフィルタリングにより、よりクリーンで信頼性の高い時間追跡データが確保されます。
チャートの説明
-
チャート1:
選択した期間内のQPSスコアに基づくセグメントボリュームの分布を表示します。
-
チャート2:
言語学者によって編集されたセグメントの割合を示します。高いQPSスコアは、編集が少ないことが期待されます。
-
チャート3:
言語学者がセグメントを編集するのにかかる時間を示します。
-
チャート4:
編集されたセグメントと未編集のセグメント(編集時間が0のセグメント)の両方を含みます。これにより、処理されたすべてのセグメントに費やされた全体的な努力の明確なイメージが得られ、前の2つのチャートからの洞察が組み合わされます。
-
チャート5:
QPS閾値が下がった場合に人間の確認を必要としない自動承認された単語の数を推定します。例えば、QPS閾値が95から90に下がると、平均自動承認単語数が950から1,750に増加する可能性があります。
-
チャート6:
QPS閾値が下がった場合にどれだけの編集時間が節約できるかを示します。
-
チャート7:
自動セグメント(自動確認または自動ロック)の割合と編集されたMTセグメントの割合を比較することによって、時間の経過に伴う編集されたセグメントの減少を追跡します。自動化が手動編集を必要とするセグメントの数を減らすことによって効率を改善している様子を示します。
ダッシュボードはLQA機能に焦点を当て、完了した評価の結果を独自の行に表示します。評価結果には問題が含まれる場合と含まれない場合があります。また、チャートはジョブ作成日を基にしています。
ダッシュボードは以下の洞察を提供します:
-
組織全体の平均品質スコアと時間の経過に伴うエラーの数。
-
最も重度のLQAエラーがあるカテゴリ。
-
高い品質スコアを維持しているプロバイダ。
-
各プロジェクトの重度別エラー数。
-
時間の経過に伴う言語ペアとクライアントごとの品質スコアのパフォーマンス。
LQAエラーのカウントには繰り返しの問題が含まれます。繰り返しの問題と非繰り返しの問題は、プロジェクト別およびプロバイダ別のテーブルで別々に表示されます。
LQAとAuto LQAの洞察の間にトグルがあります。
ダッシュボードは、ジョブの支払いに関するベンダーの見積もり情報を表示し、新規、承認済み、承認待ち、拒否されたステータスのすべての見積もりを含みます。
削除されたプロジェクトの見積もりはダッシュボードから除外されます。
-
は、見積もり内のすべてのジョブに設定された最低価格です。
-
は、見積もり内の各ジョブにかかる価格です。
-
は、実際に支払われたコストを示し、すべてのジョブのワークフローステップ、言語ペアなどで均等に分割されます。
ダッシュボードに含まれる(および見積もりテーブル):
-
ジョブの見積もりは、すべてのワークフローステップで均等に分割されます。これは、1つのワークフローステップのみを持つ分割ジョブの見積もりを含みます。
-
分割前に作成された見積もり。
ダッシュボード(および見積もりテーブル)に含まれないもの:
-
すべてのワークフローステップに不均等に分割されたジョブの見積もり。
このダッシュボードは、見積もりからの生の価格とネット価格を比較して、関連する節約を計算します。
最小価格が計算された価格よりも高い場合、見積もりには最小価格が使用されます。この場合、課金率ルールが最小価格に関連しないため、節約はゼロになります。
最小料金が存在する場合、ワードカウントの計算は適用されなくなります。
備考
従来のダッシュボードでは、最小価格が0の場合、節約は生の価格とネット価格の差として考慮されます。
このダッシュボードは、作成されたジョブの日付とジョブの期限日を基に、時間通りの配信と期限切れのジョブに焦点を当てています。ダッシュボードには、期限日があり、最後のステータスがキャンセル、拒否、またはリンギストによって拒否されたでないすべての時間通りのジョブと期限切れのジョブが含まれます。
ジョブがまだ完了としてマークされていない場合、ジョブの期限日は現在の日付と比較されます。
このダッシュボードでデータを視覚化するための2つの前提条件があります:
-
ジョブには期限日が必要です。
-
チャートを除いて、ジョブは正しいステータスの順序 - 新規、メール送信、受け入れ、完了 - に従う必要があります:
-
ジョブがメール送信された日時は、プロバイダによって受け入れられた日時以下または等しい。
-
プロバイダによって受け入れられた日時は、プロバイダによって配信されたジョブまたは完了したジョブの日時以下または等しい。
-
ジョブは同じステータスを複数回通過する可能性があるため、計算は最初の割り当てのインスタンスと最後の受け入れおよび完了のインスタンスに基づいています。
備考
すべてのジョブワークフローステップは、チャートにカウントされます。例えば、ジョブに翻訳ステップとリビジョンステップがある場合、それぞれは別々のステータスでカウントされます(異なる場合もあります)。
ダッシュボードは以下の情報を提供します:
-
時間通りと期限切れのジョブの数。
-
メタデータに基づくジョブ配信の追跡 - すなわち、クライアントとドメイン。
-
どのプロジェクトが順調で、どれがそうでないか。
-
どのクライアントとプロバイダが良好なパフォーマンスを示しているか。
-
ジョブが割り当てられ、受け入れられ、完了するまでの平均時間を言語ペアごとに分割。これにより、各状態で通常どの言語がより多くまたは少ない時間を要するかが理解できます。
-
ワークフローステップごとの平均編集時間。
フレーズデータを使用する場合、ステータスの名称は異なり、次のように相関します:
次の基準がデータに適用されます:
-
TMまたはMTによって事前翻訳されたセグメントが含まれます。TMによって事前翻訳されたセグメントは確認されなければなりません。
-
複数のジョブパーツを持つセグメントは、1つのセグメントとして考慮され、カウントされます。編集時間の合計は、すべてのジョブパーツにわたるセグメントから取得され、思考時間を考慮に入れます。
-
編集時間が30秒を超えるセグメントは、編集時間の平均には含まれませんが、事前翻訳されたセグメントチャートのカウントには含まれます。
-
すべてのジョブパーツがある時点でまたはしたジョブからのセグメントが含まれます。
-
前の6カレンダー月および現在の月に作成されたセグメントが含まれます。
チャートは次のことを強調します:
-
このチャートは、事前翻訳されたセグメントの平均編集時間を示します。TMによって事前翻訳されたセグメントの場合、TMマッチカテゴリスコアによる編集時間を示します。MTによって事前翻訳されたセグメントの場合、横線はMTセグメントの平均編集時間を示します。これは、しきい値を設定するための最適な値を示すのに役立つはずです。
-
未編集のセグメントは、0の編集時間で含まれます。
-
TMマッチスコアは、データをより良く提示するためにカテゴリ(0-69%、70-74%、...、95-99%、100-101%)にグループ化されます。
-
-
このチャートは、すべてのソースからの事前翻訳されたセグメントの全体的な平均編集時間を示します。これは、しきい値の変更が影響を与えるかどうかを確認するために使用できます。しきい値を調整することで、編集時間が短縮されるはずです。
-
このチャートは、事前翻訳を通過しているセグメントの数と、TMから返された一致カテゴリスコアを示しています。
フィルタには以下が含まれます:
-
日付 - セグメントが作成された日付です。
-
デフォルトで6ヶ月に設定されており、フレーズTMしきい値の値推奨に使用される基準に合わせています。
-
-
プロジェクトテンプレート
-
ドメイン (プロジェクトメタデータ)
-
サブドメイン (プロジェクトメタデータ)
-
ターゲットロケール (プロジェクトメタデータ)
これらのチャートは、最適なTMしきい値を特定することで言語的努力を最小限に抑えるための洞察を提供し、自動化を活用するための出発点として機能するべきです。いくつかのフィルタの組み合わせを設定すると、十分なデータが含まれていない小さなセグメントのサブセットが表示される可能性があります。
ワードカウントは、TMSで処理されたすべてのソースワード(アップロードされた)を考慮に入れます。これは、提出が行われたとき、ジョブが作成されたとき、または継続的なローカライズとソースの更新が行われたときです。ダッシュボードフィルタを調整して、削除されたジョブやゴミ箱に入れられたジョブを含めます。継続的なジョブでは、計算は最新バージョンのすべてのソースワードに基づいています。
ダッシュボードは、処理されたワードカウントに関する洞察を提供します:
-
サブスクリプション中に使用された単語。
-
月ごとの単語消費。
-
単語がプロバイダー間でどのように分配されるか。
-
どの言語ペアが最も多くの単語量を占めているか。
-
クライアントやドメインなどのメタデータによる単語量の分割。
プロジェクト作成者またはジョブ作成者によるワードカウントは、高度な分析で利用可能なカスタマイズ可能なチャートを通じて表示できます。
必要に応じて、ワードカウントの代わりに文字またはカウントに基づくチャートを表示することが可能です。チャートに関連するデータを表示するために、トグルを通じて希望するメトリックを選択してください。
異なる言語間で異なるカウント方法があるため、提示されたワードカウントは他のアプリケーションによって生成されたワードカウントと同じではない場合があります。
分析用のワードカウントはMTU計算のものとは異なります。
-
各結合タグは1つのスペースに置き換えられます。
-
他のタグは削除されます。
単語を分けるために空白を使用する言語(例:英語)では:
-
+-,.を含む各数字の列は1つの文字に置き換えられます(正規表現式[+-]?[0-9]+([., -]?[0-9]++)*+を使用)。 -
各空白の列は1つのスペースに置き換えられます。
-
セグメントの先頭と末尾の空白は削除されます。
-
スペース以外の各文字の列は1つの単語としてカウントされます。
単語を分けるために空白を使用しない言語(例:日本語)では:
-
いくつかの句読点がテキストから削除されます(正規表現式
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]を使用)。 -
セグメントは、空白でない(NWS)漢字、ひらがな、カタカナ、タイ文字の文字の列と、これらの文字に属さない文字の列(WS)に分割されます。
-
単語の総数 = (NWSからの単語数) + (WSからの単語数)。
-
WSからの単語数は英語と同様に計算されます。
-
NWSの単語数は、空白を除いた文字数です。
-
タイ語の場合、単語数は空白を除いた文字数を2で割ったものです。
他のダッシュボードの基準が必要な場合は、機能リクエストを歓迎します。