Phrase Dataは2つのティアで利用可能です。
-
ベーシック
-
プレミアム
プレミアムティアは、基本ティアと同じアクセスを提供し、さらにセグメントレベルのデータへのアクセスを提供します。
クラウドデータウェアハウス(Snowflake<1>のような)を使用すると、顧客はSQLインターフェースを通じてデータに安全にアクセスできます。
Phrase Dataは、顧客がPhraseに初めて登録した日から現在までのTMSの使用に関連するデータを表示します。Phraseは、顧客に通知の上、データが表示される期間を変更する権利を留保します。
Phrase Data統合の完全な技術文書。
Phrase Dataは戦略的意思決定を支援し、ビジネスへの影響を示し、投資を正当化することができます。データは、収益、市場浸透、顧客満足度への影響を明らかにするために、より広範な会社の指標と組み合わせることができます:
-
ウェブトラフィック、ページビュー、直帰率、ユーザーの人口統計など。
-
マーケティングデータ、クリック率、コンバージョン率、ソーシャルメディアのエンゲージメントなど。
-
顧客サポートデータ、ローカライズされたサポート資料が問題解決の迅速化や顧客満足度の向上に寄与するかを分析します。
-
売上高、ローカライズされたコンテンツから得られた収益とコストを比較します。
インサイトは、グローバルコンテンツのリーチと評判を理解し、企業のメッセージが言語を超えて成功することを保証します。
-
ローカリゼーション努力の投資収益率(ROI)
翻訳への投資がリターンを生むことを証明することで、予算を維持または増加させるのを支援するために使用されます。また、機械翻訳を使用することで時間の経過とともにコスト削減がどのように全体のROIに寄与するかを指摘します。
-
コンテンツの適応、効果、ユーザーエンゲージメント
ローカライズされたコンテンツがオーディエンスにどのように機能するかを理解します。各ロケールにおける顧客維持の追跡は、翻訳がユーザーのニーズを満たしていることを示唆しています。このフィードバックは、チームの品質戦略や、ローカルユーザーにより響くスタイルに調整する方法に影響を与える可能性があります。 顧客のユースケースは、コンテンツの適応とエンゲージメントメトリクスの相関関係を示しています。異なるプロンプトを使用して、人口統計(例:年齢、性別、地域、言語)に基づいてコンテンツをパーソナライズすることで、これによりローカルまたはキャンペーンレベルでのパフォーマンス向上を追跡します。
-
市場と言語の優先順位付け
最大の影響を与えるために、どの言語や地域に焦点を当てるかを決定するのに役立ちます。チームが最も大きなビジネスリターンを生む翻訳にリソースを割り当てることを保証します。新しい言語の展開の順序を導くことや、成長を望む市場のローカリゼーションを正当化することもできます。
-
プロセス最適化と技術戦略
ワークフローの期間と自動化の影響を評価することで、継続的なプロセス改善が促進され、適切な技術の選択に役立ちます。機械翻訳の使用が品質と速度(例:ポストエディット時間と品質スコア)にどのように影響するかを測定することで、生産性の向上を定量化します。
-
内部パフォーマンスベンチマーキング
時間が経つにつれて、単語あたりの平均コスト、特定のコンテンツタイプの平均ターンアラウンド、平均品質スコアなどの内部ベンチマークが改善のための戦略的目標となります。スマートプラクティスと効率の向上の結果を明らかにし、ローカリゼーションプログラムをさらに正当化します。
翻訳と言語的ローカリゼーションに依存する業界では、チームは意思決定を導くための堅牢なデータインサイトが必要です。ただし、分析報告とインサイトは、運用メトリクス(デイリーベースの効率、スループット、コスト)と戦略的インサイト(長期的なROI、ユーザーへの影響、市場の成長)を必要とするチームのニーズによって異なります(ローカリゼーション、コンテンツ、エグゼクティブステークホルダー)。
運用分析は、ローカリゼーションマネージャーがワークフローを合理化し、日々のコストを管理するのに役立ちます。
-
ボリューム(スループットとも呼ばれる)
時間の経過に伴う翻訳されたコンテンツの量(例:週/月あたりの単語数)を追跡することで、チームのキャパシティを示します。これはリソース計画に役立ちます。
-
タイムリーさ(ターンアラウンドタイムとも呼ばれる)
ターンアラウンドタイムは、コンテンツを翻訳するのにかかる時間を測定します。ローカリゼーションチームは、翻訳が予定通りに納品されるか、遅延が発生するかを追跡します。これは、製品の発売日、SLA、遅延の調査を満たすために重要です。
-
ベンダーとリンギストのパフォーマンス
外部翻訳ベンダーやフリーランスのリンギストが使用される場合、ローカリゼーションチームは彼らのパフォーマンスを評価したいと考えます。ベンダーごとのターンアラウンドタイム、ベンダーごとの時間通りの納品、リンギストごとの品質スコアなどの指標が追跡されます。
-
品質指標(Linguistic Quality Assurance)
最初の試みでQAチェックに合格する翻訳の割合を測定します(再作業は不要)、これは効果的な初期翻訳を示します。同様に、見つかったエラーの問題のカテゴリと重度を詳細に説明します。例えば、用語、正確さなど。
-
コストと効率の指標
通常、チームはプロジェクト、言語、または部門ごとの単語あたりのコストと総支出を追跡して、予算が満たされていることを確認します。生の翻訳コストと、TMの一致と繰り返しを維持する価値を強調するネットレートスキームを適用した後の割引コストを比較するための節約も含まれます。 例えば、新しいプロジェクトの30%の単語が100%のTM一致で翻訳された場合、チームはそれらのセグメントを再翻訳しなかったことによるコストの節約を定量化できます。
-
自動化の活用(MTとTM)
-
MT出力に必要な平均編集や時間などのポストエディット作業を評価するのに役立ちます。
-
TMの再利用効率とコスト削減を示すTM一致によるコンテンツの%を見て、TMの活用率を測定します。
-
MTによって最初に翻訳されたセグメントの%など、MTの使用率。これは、自動化のカバレッジとコスト/時間削減の機会を示します - プレミアムのみ。
-
翻訳メモリ(TM)の利用
TMが最後に使用された時期と、再利用されたセグメントの数を追跡します。これにより、TMの新鮮さ、価値の貢献、古いTMがまだ維持する価値があるかどうかを評価するのに役立ちます。
提案された分析:
-
を使用し、translation_origin = TM
でフィルタリングします。-
TMは
translation_memory_id
を使用して特定できます。 -
TMごとにセグメントを集計し、
date_created
フィールドを使用してTMが使用された時期を確認します。また、平均editing_time_ms
とscore
を計算して確認することも良いです。
-
-
とjob_id
を使用して結合し、言語情報(例:target_locale
)を抽出します。 -
2とproject_id
を使用して結合し、ドメイン、クライアント、ビジネスユニットなどによる使用状況を文脈化します。
メリット:
-
コスト削減:使用されていないまたは低パフォーマンスのTMを廃止して、メンテナンスの負担を軽減します。
-
クオリティ高いポストエディット作業を伴う老朽化したTMを特定し、適切なアクションをフラグします。
-
効率:編集時間を短縮し、自動確認を増加させる高パフォーマンスのTMを使用します。TMの閾値を適切に調整することを検討してください。
機械翻訳(MT)エンジンの最適化
QPS(セグメントあたりの品質スコア)とポストエディット時間でMTエンジンを比較し、コンテンツを適切なMTエンジンによりインテリジェントにルーティングできるようにします。
提案された分析:
-
を使用し、翻訳元 = MT
でフィルタをかけます。 -
と機械翻訳設定_id
を使用して結合します。-
MTエンジンは
機械翻訳設定名
を使用して特定できます。 -
MTエンジンごとにセグメントを集計し、
セグメント_id
の合計、平均QPS、および平均編集時間_ms
を計算します。
-
-
とjob_id
を使用して結合し、言語情報(例:target_locale
)を抽出します。 -
ドメイン、クライアント、ビジネスユニットなどの異なるコンテンツタイプのために
と結合します。
メリット:
-
コスト削減:コンテンツタイプと言語に最も適したジョブのために、歴史的に低い編集率を持つ正しいエンジンを特定して使用します。
-
ターンアラウンドタイムを定量化:言語ペア、コンテンツタイプなどの編集時間を調べることによって。
自動確認セグメントを最大化します(すなわち、手を加えないコンテンツ)。
高いQPSと編集時間がないポイントを特定し、自動確認のために人間のレビューを必要としないコンテンツをできるだけ多く分離します。
提案された分析:
-
Use
:-
セグメント
翻訳元 = MT
、確認済 = true
、編集時間_ms = 0
、および確認ソース = MT
でフィルタします。 -
セグメント数(
セグメント_id
)、ワード数(処理された単語
)をQPS
で集計します。 -
とjob_id
を使用して結合し、言語情報(例:target_locale
)を抽出します。 -
と結合し、プロジェクト_id
を使用してコンテンツメタデータを抽出します。
-
メリット:
-
コスト削減:品質がすでに十分良好な場合に、自動確認を増やし、編集時間を短縮するための最適なQPS閾値を見つけます。
-
ターンアラウンドタイムを短縮:不必要にレビューされるコンテンツを避けます。
クエリテンプレート
関連するテーブルを使って始めるためのガイドとして使用するサンプルクエリ:
選択 ssv.qps ,DATE(DATE_TRUNC('month', ssv.date_created)) AS date_month ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv 場所 ssv.date_created >= DATEADD('day', -365, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと ssv.qps ,DATE(DATE_TRUNC('month', ssv.date_created));
選択 ssv.qps ,pcmv.custom_field_name ,pcmv.custom_field_values ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN job_v2 jv ON ssv.job_id = jv.job_id JOIN project_custom_metadata_v2 pcmv ON jv.project_id = pcmv.project_id 場所 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと ssv.qps ,pcmv.custom_field_name ,pcmv.custom_field_values;
選択 ssv.qps ,jv.locale_pair ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN job_v2 jv ON ssv.job_id = jv.job_id 場所 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと ssv.qps ,jv.locale_pair;
選択 ssv.qps ,mtsv.machine_translate_setting_type ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN machine_translate_setting_v2 mtsv ON ssv.machine_translate_setting_id = mtsv.machine_translate_setting_id 場所 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと ssv.qps ,mtsv.machine_translate_setting_type;
選択 QPS ,COUNT(DISTINCT segment_id) AS mt_segments ,COUNT(DISTINCT IFF(LOWER(confirmation_source) IN ('mt', 'tm', 'nt', 'ir', 'ut'), segment_id, NULL)) AS mt_segments_autoconfirmed FROM segment_statistic_v2 場所 date_created >= DATEADD('day', -28, CURRENT_DATE) AND date_created < CURRENT_DATE AND translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと QPS
選択 QPS ,COUNT(DISTINCT segment_id) AS mt_segments ,COUNT(DISTINCT IFF(COALESCE(editing_time_ms, 0) > 0, segment_id, NULL)) AS mt_segments_edited FROM segment_statistic_v2 場所 date_created >= DATEADD('day', -28, CURRENT_DATE) AND date_created < CURRENT_DATE AND translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと QPS
WITH qps_segments AS ( 選択 ssv.qps ,SUM(words_processed) AS words_processed FROM segment_statistic_v2 ssv 場所 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MTによって事前翻訳されたセグメント グループごと ssv.qps 選択 qps AS new_qps_threshold ,SUM(words_processed) OVER (ORDER BY qps DESC) AS words_saved FROM qps_segments;