Phrase Data는 두 가지 계층으로 제공됩니다:
-
기본
-
프리미엄
프리미엄 계층은 기본 계층과 동일한 액세스를 제공하며, 세그먼트 수준 데이터에 대한 액세스도 포함됩니다.
클라우드 데이터 웨어하우스(예: Snowflake)는 고객이 SQL 인터페이스를 통해 데이터를 안전하게 액세스할 수 있도록 합니다.
Phrase Data는 고객이 Phrase에 처음 가입한 날짜부터 현재까지 TMS 사용과 관련된 데이터를 표시합니다. Phrase는 고객에게 통지한 후 데이터가 표시되는 기간을 변경할 권리를 보유합니다.
Phrase Data 통합의 전체 기술 문서.
Phrase Data는 전략적 의사 결정을 지원하고, 비즈니스 영향을 보여주며, 투자를 정당화할 수 있습니다. 데이터는 수익, 시장 침투 및 고객 만족도에 미치는 영향을 드러내기 위해 더 넓은 회사 메트릭과 결합될 수 있습니다:
-
웹 트래픽, 페이지 조회수, 이탈률, 사용자 인구 통계와 같은.
-
마케팅 데이터, 클릭률, 전환율, 소셜 미디어 참여와 같은.
-
고객 지원 데이터, 현지화된 지원 자료가 문제 해결 속도와 고객 만족도를 높이는지 분석합니다.
-
판매 수치, 현지화된 콘텐츠에서 발생한 수익과 비용을 비교합니다.
통찰력은 글로벌 콘텐츠의 도달 범위와 평판을 이해하는 데 도움을 주며, 회사의 메시지가 언어를 초월하여 성공하도록 보장합니다.
-
현지화 노력의 투자 수익(ROI)
번역에 대한 투자가 수익을 창출한다는 것을 입증하여 예산을 유지하거나 증가시키는 데 지원하는 데 사용됩니다. 또한 기계 번역을 사용하여 시간이 지남에 따라 비용 절감이 전체 ROI에 기여하는 방법을 지적합니다.
-
콘텐츠 적응, 효능 및 사용자 참여
현지화된 콘텐츠가 청중과 어떻게 수행되는지 이해합니다. 각 로캘에서 고객 유지 추적은 번역이 사용자 요구를 충족하고 있음을 시사합니다. 이 피드백은 팀의 품질 전략에 영향을 미치거나 스타일을 조정하여 지역 사용자와 더 잘 공감할 수 있도록 할 수 있습니다. 고객 사용 사례는 콘텐츠 적응과 참여 지표 간의 상관관계를 나타냅니다. 인구 통계(예: 나이, 성별, 지역, 언어)를 기반으로 콘텐츠를 개인화하기 위해 AutoAdapt와 함께 다양한 프롬프트를 사용하면, 이는 지역 또는 캠페인 수준에서 성과 향상을 추적할 수 있습니다.
-
시장 및 언어 우선 순위
최대 영향을 위해 집중할 언어 또는 지역을 결정하는 데 도움이 됩니다. 팀이 가장 큰 비즈니스 수익을 가져오는 번역에 자원을 할당하도록 보장합니다. 또한 새로운 언어 롤아웃의 순서를 안내하거나 성장하고자 하는 시장에 대한 현지화를 정당화할 수 있습니다.
-
프로세스 최적화 및 기술 전략
워크플로 기간 및 자동화 영향을 평가하면 지속적인 프로세스 개선으로 이어지고 올바른 기술 선택에 도움이 됩니다. 품질 및 속도 측면에서 기계 번역의 사용 증가(예: 사후 편집 시간 및 품질 점수)가 생산성 향상을 정량화합니다.
-
내부 성과 벤치마킹
시간이 지남에 따라 평균 단어당 비용, 특정 콘텐츠 유형에 대한 평균 처리 시간 및 평균 품질 점수와 같은 내부 벤치마크는 개선을 위한 전략적 목표가 됩니다. 이는 스마트 관행과 효율성 향상의 결과를 드러내어 현지화 프로그램을 정당화합니다.
번역 및 언어 현지화에 의존하는 모든 산업에서 팀은 결정을 안내할 강력한 데이터 통찰력이 필요합니다. 그러나 분석 보고서 및 통찰력은 팀의 필요(현지화, 콘텐츠, 경영진 이해관계자)에 따라 다르며, 이들은 운영 지표(일상적인 효율성, 처리량, 비용)와 전략적 통찰력(장기 ROI, 사용자 영향, 시장 성장)을 요구합니다.
운영 분석은 현지화 관리자가 워크플로를 간소화하고 일상적으로 비용을 관리하는 데 도움을 줍니다.
-
볼륨(처리량이라고도 함)
시간에 따라 번역된 콘텐츠의 양(예: 주/월당 단어 수)을 추적하면 팀의 용량을 나타냅니다. 이것은 자원 계획에 도움이 됩니다.
-
적시성(턴어라운드 타임으로도 알려짐)
턴어라운드 타임은 콘텐츠를 처음부터 끝까지 번역하는 데 걸리는 시간을 측정합니다. 로컬라이제이션 팀은 번역이 일정에 맞춰 제공되는지 또는 지연되는지를 추적합니다. 이는 제품 출시 날짜, SLA 및 지연 조사에 매우 중요합니다.
-
공급자 및 번역자 성과
외부 번역 공급자나 프리랜서 번역자를 사용하는 경우, 로컬라이제이션 팀은 그들의 성과를 평가하고자 할 것입니다. 공급자별 턴어라운드 타임, 공급자별 정시 배송 및 번역자별 품질 점수와 같은 지표가 추적됩니다.
-
품질 지표 (언어 품질 보증)
첫 번째 시도에서 QA 검사를 통과하는 번역의 비율(재작업 필요 없음)을 측정하여 효과적인 초기 번역을 나타냅니다. 유사하게, 발견된 오류 문제의 범주와 심각도를 자세히 설명합니다. 예: 용어, 정확성 등.
-
비용 및 효율성 지표
일반적으로 팀은 예산이 충족되도록 프로젝트, 언어 또는 부서별로 단어당 비용 및 총 지출을 추적합니다. 원시 번역 비용과 순 요율제를 적용한 할인 비용을 비교하여 TM 일치 및 반복을 유지하는 가치를 강조하는 절감액도 추적합니다. 예를 들어, 새로운 프로젝트의 30%의 단어가 100% TM 일치로 번역되었다면, 팀은 해당 세그먼트를 재번역하지 않음으로써 절감된 비용을 정량화할 수 있습니다.
-
자동화 활용(MT 및 TM)
-
MT 출력에 필요한 평균 수정 또는 시간과 같은 사후 편집 노력을 통해 MT를 평가하는 데 도움을 줍니다.
-
TM 일치에 따른 콘텐츠 비율을 살펴보아 TM 활용률을 확인하여 TM 재사용 효율성과 비용 절감을 나타냅니다.
-
MT 사용률, 예를 들어 MT에 의해 처음 번역된 세그먼트의 비율과 같은 것입니다. 이는 자동화 범위 및 비용/시간 절감 기회를 제시합니다 - 프리미엄 전용.
-
번역 메모리 (TM) 활용
TM이 마지막으로 사용된 시점과 시간이 지남에 따라 재사용된 세그먼트 수를 추적합니다. 이는 TM의 신선도, 가치 기여도 및 구식 TM을 유지할 가치가 있는지 평가하는 데 도움이 됩니다.
제안된 분석:
-
을 사용하고translation_origin = TM
에서 필터링합니다.-
TM은
translation_memory_id
를 사용하여 식별할 수 있습니다. -
TM별로 세그먼트를 집계하고
date_created
필드를 사용하여 TM이 사용된 시점을 확인합니다. 평균editing_time_ms
및score
를 계산하고 확인하는 것도 좋습니다.
-
-
job_id
를 사용하여 와 결합하여 언어 정보를 추출합니다. 예:target_locale
. -
project_id
를 사용하여 2와 결합하여 도메인, 클라이언트, 비즈니스 단위 등에 따라 사용을 맥락화합니다.
이점:
-
비용 절감: 사용되지 않거나 성능이 낮은 TM을 종료하여 유지 관리 오버헤드를 줄이는 데 도움이 됩니다.
-
품질 높은 사후 편집 노력이 드는 노후 TM을 식별하고 적절한 조치를 표시합니다.
-
효율성: 편집 시간을 줄이고 자동 확인을 증가시키는 고성능 TM을 사용합니다. TM 임계값을 적절히 조정하는 것을 고려하십시오.
기계 번역 (MT) 엔진 최적화
QPS(세그먼트당 품질 점수) 및 사후 편집 시간을 기준으로 MT 엔진을 비교하여 콘텐츠를 올바른 MT 엔진으로 보다 지능적으로 라우팅할 수 있습니다.
제안된 분석:
-
를 사용하고번역 출처 = MT
에 필터를 적용합니다. -
와기계 번역 설정 ID
를 사용하여 결합합니다.-
MT 엔진은
기계 번역 설정 이름
을 사용하여 식별할 수 있습니다. -
MT 엔진별로 세그먼트를 집계하고
세그먼트 ID
의 합계, 평균 QPS 및 평균편집 시간(ms)
를 계산합니다.
-
-
job_id
를 사용하여 와 결합하여 언어 정보를 추출합니다. 예:target_locale
. -
도메인, 클라이언트, 비즈니스 단위 등과 같은 다양한 콘텐츠 유형에 대해
와 결합합니다.
이점:
-
비용 절감: 역사적으로 낮은 편집 비율을 가진 콘텐츠 유형 및 언어에 가장 적합한 작업에 대한 올바른 엔진을 식별하고 사용합니다.
-
처리 시간 정량화: 언어 쌍, 콘텐츠 유형 등에 따른 편집 시간을 살펴봅니다.
자동 확인 세그먼트 최대화(즉, 터치하지 않은 콘텐츠)
높은 QPS와 편집 시간이 없는 자동 확인이 가능한 가장 효율적인 지점을 식별하여 가능한 한 많은 콘텐츠를 인간 검토가 필요하지 않도록 분리합니다.
제안된 분석:
-
Use
:-
세그먼트
번역 출처 = MT
,확인됨 = true
,편집 시간(ms) = 0
, 및확인 출처 = MT
인 경우 필터링합니다. -
세그먼트 ID
에 따른 세그먼트 수,처리된 단어 수
를QPS
로 집계합니다. -
job_id
를 사용하여 와 결합하여 언어 정보를 추출합니다. 예:target_locale
. -
와 결합하여프로젝트 ID
를 사용하여 콘텐츠 메타데이터를 추출합니다.
-
이점:
-
비용 절감: 품질이 이미 충분히 좋은 경우 자동 확인을 증가시키고 편집 시간을 줄이기 위한 최적의 QPS 임계값을 찾습니다.
-
처리 시간 단축: 불필요한 콘텐츠 검토를 피합니다.
쿼리 템플릿
관련 테이블을 시작하는 데 도움이 되는 샘플 쿼리:
선택 ssv.qps ,DATE(DATE_TRUNC('month', ssv.date_created)) AS date_month ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv 위치 ssv.date_created >= DATEADD('day', -365, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MT에 의해 사전 번역된 세그먼트 그룹화 기준 ssv.qps ,DATE(DATE_TRUNC('month', ssv.date_created));
선택 ssv.qps ,pcmv.custom_field_name ,pcmv.custom_field_values ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN job_v2 jv ON ssv.job_id = jv.job_id JOIN project_custom_metadata_v2 pcmv ON jv.project_id = pcmv.project_id 위치 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MT에 의해 사전 번역된 세그먼트 그룹화 기준 ssv.qps ,pcmv.custom_field_name ,pcmv.custom_field_values;
선택 ssv.qps ,jv.locale_pair ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN job_v2 jv ON ssv.job_id = jv.job_id 위치 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MT에 의해 사전 번역된 세그먼트 그룹화 기준 ssv.qps ,jv.locale_pair;
선택 ssv.qps ,mtsv.machine_translate_setting_type ,COUNT(DISTINCT segment_id) AS mt_segments FROM segment_statistic_v2 ssv JOIN machine_translate_setting_v2 mtsv ON ssv.machine_translate_setting_id = mtsv.machine_translate_setting_id 위치 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MT에 의해 사전 번역된 세그먼트 그룹화 기준 ssv.qps ,mtsv.machine_translate_setting_type;
선택 QPS ,COUNT(DISTINCT segment_id) AS mt_segments ,COUNT(DISTINCT IFF(LOWER(confirmation_source) IN ('mt', 'tm', 'nt', 'ir', 'ut'), segment_id, NULL)) AS mt_segments_autoconfirmed FROM segment_statistic_v2 위치 date_created >= DATEADD('day', -28, CURRENT_DATE) 그리고 생성일 < CURRENT_DATE 그리고 번역 출처 = 'mt' -- MT로 사전 번역된 세그먼트 그룹화 기준 qps;
선택 QPS ,COUNT(DISTINCT segment_id) AS mt_segments ,COUNT(DISTINCT IFF(COALESCE(editing_time_ms, 0) > 0, segment_id, NULL)) AS mt_segments_edited FROM segment_statistic_v2 위치 date_created >= DATEADD('day', -28, CURRENT_DATE) 그리고 생성일 < CURRENT_DATE 그리고 번역 출처 = 'mt' -- MT로 사전 번역된 세그먼트 그룹화 기준 Qps;
WITH qps_segments AS ( 선택 ssv.qps ,SUM(처리된_단어) AS 처리된_단어 FROM segment_statistic_v2 ssv 위치 ssv.date_created >= DATEADD('day', -28, CURRENT_DATE) AND ssv.date_created < CURRENT_DATE AND ssv.translation_origin = 'mt' -- MT에 의해 사전 번역된 세그먼트 그룹화 기준 ssv.qps ) 선택 qps AS new_qps_threshold ,SUM(처리된_단어) OVER (ORDER BY qps DESC) AS 절약된_단어 FROM qps_segments;