분석 대시보드는 탐색 패널의 Phrase Analytics 버튼에서 액세스됩니다.
-
공급자에 의해 표시되는 차트에는 언어 전문가와 공급업체가 모두 포함됩니다.
-
언어 쌍은 소스 언어에서 대상 언어로의 연결로 표시됩니다.
-
프로젝트에 의해 표시되는 차트는 처음 10,000개의 프로젝트만 표시하며, 전체 프로젝트 목록은 다운로드할 때 포함됩니다.
-
대시보드는 UTC 시간대의 데이터를 표시합니다.
-
대시보드는 하루에 두 번 새로 고쳐집니다:
-
EU 인스턴스의 경우 12:00am 및 12:00pm UTC
-
US 인스턴스의 경우 07:00am 및 19:00pm UTC
각 대시보드는 마지막 데이터 새로 고침 완료 시기를 보여줍니다. 표시된 타임스탬프는 최대 3시간 전에 생성된 데이터를 포함하지 않을 수 있습니다. 데이터 새로고침 프로세스를 트리거하면 거래가 적시에 캡처되지 않을 수 있습니다.
-
-
데이터 보고서는 지난 12개월 동안 사용할 수 있으며, 사용자가 언제든지 전체 연도를 가질 수 있습니다.
대시보드에 대한 비디오 리뷰:
고급 분석 차트 및 대시보드를 보기 위한 프로젝트 관리자 역할의 액세스 권한은 사용자 설정에서 관리자가 설정할 수 있습니다.
모든 대시보드는 선택된 데이터를 차트에 표시하기 위한 다양한 필터를 지원합니다. 특히, 작업 상태 필터는 다음 작업 상태를 고려합니다:
-
.
-
.
작업이나 프로젝트가 삭제되면, 작업은 휴지통에 있는 동안 이 상태로 표시됩니다.
-
.
휴지통을 수동으로 또는 자동으로 비워서 제거된 작업입니다.
-
.
참고
작업이 보관되면 상태가 보관됨으로 변경됩니다. 프로젝트가 보관되면 작업의 상태는 변경되지 않습니다.
성능이 저하될 수 있고 차트가 더 이상 정의를 유지하지 않을 수 있으므로 날짜 필터는 1년 이상 실행하지 않는 것이 좋습니다.
모든 차트는 .csv, .xlsx, .json 및 .png 파일 형식으로 다운로드할 수 있습니다. 차트 오른쪽 상단의 3점 버튼을 클릭하고 결과 다운로드를 선택하십시오:
-
큰 숫자에 쉼표 구분 기호가 포함된 형식화된 결과를 다운로드하려면
창에서 원하는 파일 형식을 선택하십시오. -
형식이 지정되지 않은 결과를 다운로드하려면 Shift (Windows) 또는 Option (Mac) 키를 누르고 창에서 원하는 파일 형식을 선택하십시오.
공유 콘텐츠의 데이터는 모든 대시보드에서 지원됩니다.
여러 대시보드에는 조직이 소유한 데이터와 조직 간에 공유된 데이터를 구분하는 데 도움이 되는 소유권 필터가 포함되어 있습니다:
-
필터는 조직이 작업의 생성자인지 여부를 식별합니다.
-
조직에서 생성한 작업(공유 여부와 관계없이).
-
조직과 공유되거나 조직에 의해 공유된 작업, 생성자가 누구인지와 관계없이.
-
-
필터는 조직이 LQA 평가의 생성자인지 여부를 식별합니다.
검토 제공자는 소유자로 간주되므로 조직의 뷰는 평가를
로 표시합니다. 다른 조직의 사용자(예: 번역 제공자, 프로젝트 구매자 또는 공급자)는 아래에 동일한 평가가 나열된 것을 볼 수 있습니다.제공자가 귀하의 조직에 속하는 경우, 그들의 사용자 이름과 전체 이름이 표시됩니다. 제공자가 다른 조직에 속하는 경우, 그들의 사용자 ID와 조직 이름이 점수 카드에 표시됩니다.
-
필터는 조직이 견적의 작성자인지 여부를 식별합니다.
-
필터는 조직이 분석의 작성자인지 여부를 식별합니다.
차트는 가격 메트릭(예: 단어 수, 글자 수, 페이지 또는 시간)을 기준으로 계산된 조직의 실제 지출을 보여주며, 가격 목록에 곱해집니다.
비용 대시보드는 다음을 기반으로 합니다:
-
프로젝트의 모든 워크플로 단계에 대한 견적.
참고
같은 워크플로 단계에 대한 새 견적을 생성하면 이전에 생성된 견적의 데이터가 덮어씌워집니다.
-
프로젝트의 모든 시간당 견적과 각 작업에 대한 표준 견적의 최신 견적.
공유 프로젝트(또는 지정된 공급자가 있는 견적)에서는 견적이 모든 사용자에게 표시되지만 최신 견적은 각 사용자마다 다를 수 있습니다.
작업에 공급자를 할당할 때 고려해야 할 사항:
-
작업 생성 중에 공급자가 할당되면, 그들의 가격 목록이 프로젝트의 가격 목록을 덮어씁니다.
-
나중에 공급자가 할당되면, 비용이 자동으로 재계산되지 않습니다.
지정된 사용자에게 견적을 생성하여 데이터를 적절히 업데이트합니다.
-
작업 부분에 여러 공급자가 할당된 경우, 첫 번째로 나열된 공급자의 데이터가 사용됩니다.
다른 사용자의 가격 정보를 사용하기 위해 새 견적을 생성합니다.
차트는 번역 메모리(TM), 기계 번역(MT), 반복 및 비번역 항목(NT)이 작업 전반에 걸쳐 어떻게 활용되는지를 보여줍니다.
활용은 특정 일치 카테고리에서 순 요율제를 적용하기 전의 단어 수와 순 요율제를 적용한 후의 단어 수의 차이로 계산됩니다.
대시보드는 다음을 기반으로 합니다:
-
기본 분석의 데이터.
-
주어진 작업에 대한 마지막 실행 분석의 데이터입니다.
데이터는 분석이 생성되기 전에 프로젝트에 추가된 순 요율제 또는 작업에 할당된 공급자에게만 생성됩니다. 프로젝트나 분석에서 순 요율제가 변경되면 분석은 최신 정보를 표시합니다.
차트는 다음 시나리오에서 데이터를 표시하지 않습니다:
-
순 요율제가 없는 프로젝트 및 작업.
-
0 레버리지를 가진 분석(예: 프로젝트, 언어 쌍 등).
-
내부 퍼지 분석이 있는 경우.
-
삭제된 분석입니다.
대시보드의 계산에는 뷰어의 조직에 속한 사용자가 생성한 분석만 포함됩니다. 따라서 구매자가 공급자와 작업을 공유하고 공급자가 분석을 생성할 때:
-
구매자는 대시보드에서 분석과 관련된 데이터를 볼 수 없습니다.
-
공급자가 분석의 생성자이므로 대시보드에서 관련 데이터를 볼 수 있습니다.
품질 성과 점수는 세그먼트 수준에서 MT 번역 품질을 추정하여 어떤 세그먼트가 자동 확인에 충분한지 결정합니다. 이것은 조직이 저품질 번역을 자동으로 감지하는 데 도움을 주어 전체 범위의 인간 검토 필요성을 줄입니다.
사전 번역된 세그먼트는 사전 번역 설정에서 설정된 QPS 임계값에 따라 자동으로 확인될 수 있습니다. QPS는 Language AI를 통해 번역된 MT 세그먼트에만 사용할 수 있습니다.
대시보드는 비용 절감과 품질 위험의 균형을 맞추기 위해 최적의 QPS 임계값을 찾는 데 도움을 줍니다.
대시보드의 필터는 기술, 법률 및 마케팅 텍스트가 다양한 품질 요구 사항을 가질 수 있으므로 다양한 콘텐츠 카테고리에 대한 최상의 값을 찾는 데 도움을 줍니다.
이러한 인사이트는 세그먼트 수준의 메트릭을 기반으로 합니다. 사용자 지정 통찰력은 Phrase Data Premium을 통해 잠금 해제할 수 있으며, 이는 원시 세그먼트 수준 데이터에 대한 액세스를 제공합니다.
포함된 데이터
-
2025년 1월 1일부터 시작된 지난 6개월(추적 시작 시점)
-
Language AI 전용, QPS는 Language AI를 통해 처리된 MT 번역에만 사용할 수 있습니다.
-
모든 Language AI 세그먼트, 소스에 관계없이 (사전 번역 또는 편집자 제안)
-
QPS 점수는 Language AI를 통해 번역된 후 원래 부여된 점수이며, 언어학자에 의한 편집 후 점수가 아닙니다.
-
구매자(공급자가 아님)는 공유 프로젝트에 대한 데이터를 봅니다.
긴 편집 시간 필터링
가끔 세그먼트의 편집 시간이 비정상적으로 길어질 수 있습니다. 이는 방해 요소(예: 전화 확인 또는 휴식) 때문일 수 있습니다. 데이터 정확성을 유지하기 위해 평균 편집 시간은 약 20초입니다. 50% 버퍼가 적용되며, 편집 시간이 30초를 초과하는 세그먼트는 제외됩니다.
일부 긴 편집이 정당할 수 있지만, 대부분은 이상치이며 노이즈를 유발합니다.
필터링의 영향:
-
대규모 데이터 세트에서는 이러한 긴 세그먼트를 필터링해도 영향이 미미합니다.
-
소규모 데이터 세트에서는 단일 장기 편집이 총 편집 시간에 불균형적으로 영향을 미칠 수 있으므로 효과가 더 두드러집니다.
이 필터링은 더 깨끗하고 신뢰할 수 있는 시간 추적 데이터를 보장합니다.
차트 설명
-
차트 1:
선택한 시간대 내에서 QPS 점수를 기반으로 세그먼트 볼륨의 분포를 표시합니다.
-
차트 2:
언어학자에 의해 편집된 세그먼트의 비율을 보여줍니다. 더 높은 QPS 점수는 편집이 적을 것으로 예상됩니다.
-
차트 3:
언어학자가 세그먼트를 편집하는 데 소요되는 시간을 보여줍니다.
-
차트 4:
편집된 세그먼트와 편집되지 않은 세그먼트(편집 시간이 0인 세그먼트)를 포함합니다. 이는 이전 두 차트의 통찰력을 결합하여 처리된 모든 세그먼트에 소요된 전체 노력을 보다 명확하게 보여줍니다.
-
차트 5:
QPS 임계값이 낮아지면 인간 검증이 필요 없는 자동 승인 단어의 수를 추정합니다. 예를 들어, QPS 임계값이 95에서 90으로 감소하면 자동 승인 단어의 평균 수가 950에서 1,750으로 증가할 수 있습니다.
-
차트 6:
QPS 임계값이 낮아지면 얼마나 많은 편집 시간을 절약할 수 있는지를 보여줍니다.
-
차트 7:
편집된 세그먼트의 비율을 비교하여 시간에 따른 편집된 세그먼트의 감소를 추적합니다.
대시보드는 LQA 기능에 중점을 두고 있으며 완료된 평가의 결과를 각 행에 표시합니다. 평가 결과에는 문제가 포함될 수도 있고 포함되지 않을 수도 있으며, 차트는 작업 생성 날짜를 기준으로 합니다.
대시보드는 다음에 대한 통찰력을 제공합니다:
-
조직 전체의 평균 품질 점수와 시간에 따른 오류 수.
-
가장 높은 심각도 LQA 오류가 있는 카테고리.
-
높은 품질 점수를 유지하는 공급자.
-
각 프로젝트별 심각도에 따른 오류 수.
-
시간에 따른 언어 쌍 및 클라이언트별 품질 점수 성과.
LQA 오류 수에는 반복된 문제가 포함됩니다. 반복된 문제와 비반복 문제는 프로젝트 및 공급자 테이블에서 별도로 표시됩니다.
LQA와 자동 LQA 통찰력 간에 전환할 수 있습니다.
대시보드는 작업 결제를 위한 공급자 견적 정보를 보여주며, 새로운, 승인된, 승인 대기 중 및 거부된 상태의 모든 견적을 포함합니다.
삭제된 프로젝트의 견적은 대시보드에서 제외됩니다.
-
은 견적 내 모든 작업에 대해 설정된 최소 가격입니다.
-
은 견적 내 각 작업에 대해 발생하는 가격입니다.
-
은 모든 작업 워크플로 단계, 언어 쌍 등에서 균등하게 분할된 실제 비용을 보여줍니다.
대시보드에 포함됨 (및 견적 테이블):
-
모든 워크플로 단계에 균등하게 분할된 작업에 대한 견적입니다. 여기에는 단 하나의 워크플로 단계가 있는 분할 작업에 대한 견적이 포함됩니다.
-
분할 이전에 생성된 견적입니다.
대시보드에 포함되지 않음 (및 견적 테이블):
-
모든 워크플로 단계에 불균등하게 분할된 작업에 대한 견적입니다.
이 대시보드는 견적의 원가와 순가를 비교하여 관련 절약을 계산합니다.
최소 가격이 계산된 가격보다 높으면, 최소 가격이 견적에 사용됩니다. 이 경우, 절약은 0이 되며, 순 요율제는 최소 가격에 대해 관련이 없습니다.
최소 요금이 존재하는 경우, 단어 수 계산은 더 이상 적용되지 않습니다.
참고
레거시
대시보드에서 최소 가격이 0일 때, 절약은 원가와 순가의 차이로 간주됩니다.이 대시보드는 생성된 작업 날짜와 작업 마감일을 기준으로 제시간에 납품된 작업과 연체된 작업을 비교합니다. 취소됨, 거부됨 또는 번역자에 의해 거부됨이 아닙니다.
대시보드는 마감일이 있는 모든 제시간에 납품된 작업과 연체된 작업을 포함하며, 마지막 상태가작업이 아직 완료로 표시되지 않은 경우, 작업 마감일은 현재 날짜와 비교됩니다.
이 대시보드에서 데이터가 시각화되기 위한 두 가지 전제 조건이 있습니다:
-
작업에는 마감일이 필요합니다.
-
차트를 제외하고, 작업은 올바른 상태 순서 - 새로, 이메일 발송, 수락, 완료를 따라야 합니다:
-
작업이 이메일로 전송된 날짜/시간은 공급자가 수락한 날짜/시간보다 작거나 같아야 합니다.
-
공급자가 수락한 작업의 날짜/시간은 공급자가 전달한 작업 또는 완료한 작업의 날짜/시간보다 작거나 같아야 합니다.
-
작업이 동일한 상태를 여러 번 거칠 수 있으므로, 계산은 할당의 첫 번째 인스턴스와 수락 및 완료의 마지막 인스턴스를 기준으로 합니다.
참고
모든 작업 워크플로 단계는 번역 단계와 수정 단계가 있는 경우, 각 단계는 별도의 상태로 계산됩니다(상태가 다를 수도 있고 같을 수도 있음).
차트에 포함됩니다. 예를 들어, 작업에대시보드는 다음에 대한 통찰력을 제공합니다:
-
시간 내에 완료된 작업과 기한이 지난 작업의 수.
-
메타데이터를 기반으로 한 작업 전달 추적 - 즉, 클라이언트 및 도메인.
-
어떤 프로젝트가 순조롭게 진행되고 있고 어떤 프로젝트가 그렇지 않은지.
-
어떤 클라이언트와 공급자가 성과가 좋은지.
-
언어 쌍별로 할당, 수락 및 완료되는 데 걸리는 평균 시간. 이는 각 상태에서 일반적으로 더 많은 시간 또는 적은 시간이 소요되는 언어에 대한 이해를 제공합니다.
-
각 워크플로 단계당 평균 편집 시간.
구문 데이터를 사용하는 경우, 상태 명칭이 다르며 다음과 같이 상관관계가 있습니다:
다음 기준이 데이터에 적용됩니다:
-
TM 또는 MT로 사전 번역된 세그먼트가 포함됩니다.
-
여러 작업 부분이 있는 세그먼트는 하나의 세그먼트로 간주되고 계산됩니다. 편집 시간의 합계는 모든 작업 부분의 세그먼트에서 가져옵니다.
-
편집 시간이 30초를 초과하는 세그먼트는 편집 시간 평균에 포함되지 않지만, 사전 번역된 세그먼트 차트의 수에는 포함됩니다.
-
모든 작업 부분이 어느 시점에서
또는 인 작업의 세그먼트가 포함됩니다. -
이전 6개월 및 현재 월에 생성된 세그먼트가 포함됩니다.
차트 강조:
-
이 차트는 사전 번역된 세그먼트의 평균 편집 시간을 보여줍니다. TM으로 사전 번역된 세그먼트의 경우, TM 일치 카테고리 점수별 편집 시간을 보여줍니다. MT로 사전 번역된 세그먼트의 경우, 수평선은 MT 세그먼트의 평균 편집 시간을 보여줍니다. 이는 임계값을 설정하는 데 최적의 값을 나타내는 데 도움이 될 것입니다.
-
편집되지 않은 세그먼트는 0 편집 시간으로 포함됩니다.
-
TM 일치 점수는 데이터를 더 잘 제시하기 위해 카테고리(0-69%, 70-74%,..., 95-99%, 100-101%)로 그룹화됩니다.
-
-
이 차트는 모든 출처의 사전 번역된 세그먼트의 전체 평균 편집 시간을 보여줍니다. 이는 임계값 변경이 영향을 미치는지 확인하는 데 사용될 수 있습니다. 임계값 조정은 편집 시간이 줄어드는 결과를 가져와야 합니다.
-
이 차트는 사전 번역을 거치는 세그먼트 수와 TM에서 반환된 일치 카테고리 점수를 보여줍니다.
필터에는 다음이 포함됩니다:
-
날짜 - 세그먼트가 생성된 날짜입니다.
-
기본적으로 6개월로 설정되어 있으며, 이는 Phrase TM threshold 값 추천에 사용되는 기준과 일치합니다.
-
-
프로젝트 템플릿
-
도메인 (project metadata)
-
하위 도메인 (프로젝트 메타데이터)
-
대상 로캘 (프로젝트 메타데이터)
이 차트는 최적의 TM 임계값을 식별하여 언어적 노력을 최소화하는 데 도움이 되는 통찰력을 제공합니다. 이는 자동화를 활용하기 위한 출발점으로 삼아야 합니다. 여러 필터 조합을 설정하면 충분한 데이터를 제공하지 않는 세그먼트의 작은 하위 집합이 표시될 수 있습니다.
단어 수는 TMS에서 처리된 모든 소스 단어(업로드된 단어)를 고려합니다. 제출이 이루어지거나 작업이 생성되거나 연속 현지화 및 업데이트 소스가 완료될 때 포함됩니다. 대시보드 필터를 조정하여 삭제된 작업이나 휴지통에 있는 작업을 포함합니다. 연속 작업의 경우, 계산은 마지막 버전의 모든 소스 단어를 기준으로 합니다.
대시보드는 처리된 단어 수에 대한 통찰력을 제공합니다:
-
구독 기간 동안 사용된 단어 수.
-
월별 단어 소비.
-
제공자 간의 단어 분포.
-
어떤 언어 쌍이 가장 높은 단어 볼륨을 차지하는지.
-
클라이언트 및 도메인과 같은 메타데이터에 따라 분할된 단어 볼륨.
프로젝트 생성자 또는 작업 생성자에 의한 단어 수는 advanced analytics에서 제공되는 사용자 정의 차트를 통해 표시될 수 있습니다.
필요한 경우, 단어 수 대신 글자 또는 수를 기준으로 차트를 볼 수 있습니다. 원하는 메트릭을 토글을 통해 선택하여 차트에 관련 데이터를 표시합니다.
다양한 언어에서 서로 다른 계산 방법으로 인해, 제시된 단어 수는 다른 애플리케이션에서 생성된 단어 수와 같지 않을 수 있습니다.
분석을 위한 단어 수는 MTU 계산의 단어 수와 다릅니다.
-
각 결합 태그는 하나의 공백으로 대체됩니다.
-
다른 태그는 제거됩니다.
단어를 구분하기 위해 공백을 사용하는 언어(예: 영어)에서는:
-
각 숫자 시퀀스는
+-,.
를 포함하여 하나의 문자로 대체됩니다(정규 표현식 regex 표현식[+-]?[0-9]+([., -]?[0-9]++)*+
사용). -
각 공백 시퀀스는 하나의 공백으로 대체됩니다.
-
세그먼트의 시작과 끝에 있는 공백은 제거됩니다.
-
공백과 다른 각 문자 시퀀스는 하나의 단어로 계산됩니다.
단어를 구분하기 위해 공백을 사용하지 않는 언어(예: 일본어)에서는:
-
일부 구두점은 텍스트에서 제거됩니다(정규 표현식
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]
사용). -
세그먼트는 비공백(NWS) 한자, 히라가나, 가타카나 및 태국 문자에 속하는 문자 시퀀스와 이러한 문자에 속하지 않는 문자 시퀀스로 분할됩니다(WS).
-
총 단어 수 = (NWS의 단어 수) + (WS의 단어 수).
-
WS의 단어 수는 영어와 같이 계산됩니다.
-
NWS의 단어 수는 공백이 없는 문자 수입니다.
다른 대시보드 기준이 필요한 경우, 기능 요청을 환영합니다.