Analýza počítá znaky a slova ve vybraných souborech a identifikuje:
-
Opakování (včetně opakování napříč soubory)
-
Nepřekládaný text
-
Interní částečné shody
Analýzy mohou také ukázat počet revizí provedených korektorem.
Analýzy mohou být vytvořeny manažery projektů nebo administrátory. Jazykovědci nemohou být povoleni k provádění vlastních analýz. Dodavatelé mohou vytvářet analýzy pro sdílené úkoly/projekty.
Některé CAT nástroje označují analýzu jako statistiky.
Organizační analytika je poskytována hlavním panelem analytiky.
Jelikož se v různých zemích používají různé fakturační jednotky, jsou k dispozici tři metody výpočtu:
-
Znaky
Bez mezer.
-
Slova
Pro jazyky, které používají mezery mezi slovy—s výjimkou čínštiny, japonštiny a thajštiny.
-
Strany
1800 znaků včetně mezer—nesouvisející s aktuálním počtem stran v souboru.
Vzhledem k různým metodám počítání v různých jazycích se může počet slov, jak je uveden, lišit od počtů slov generovaných jinými aplikacemi.
Počet slov pro analýzu se liší od počtu MTU výpočtu.
-
Každý tag sloučení je nahrazen jedním prostorem.
-
Ostatní tagy jsou odstraněny.
V jazycích používajících whitespace pro oddělování slov (např. angličtina):
-
Každá sekvence čísel včetně
+-,.je nahrazena jedním znakem (použitím regex výrazu[+-]?[0-9]+([., -]?[0-9]++)*+). -
Každá sekvence mezer je nahrazena jedním prostorem.
-
Mezery na začátku a na konci segmentu jsou odstraněny.
-
Každá sekvence znaků odlišných od mezery se počítá jako jedno slovo.
V jazycích, které nepoužívají mezery pro oddělování slov (např. japonština):
-
Některé interpunkční znaménka jsou odstraněna z textu (použitím regex výrazu
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]). -
Segment je rozdělen na sekvence znaků patřících k ne-mezerním (NWS) Han, Hiragana, Katakana a thajským skriptům a sekvence znaků, které k těmto skriptům nepatří (WS).
-
Celkový počet slov = (počet slov z NWS) + (počet slov z WS).
-
Počet slov z WS se počítá jako pro angličtinu.
-
Počet slov pro NWS je počet znaků bez mezer.
-
Pro thajštinu je počet slov počet znaků bez mezer dělený 2.
Poznámka
Znaky z CJK jazyků se počítají jako znaky i slova.
Pro vytvoření analýzy postupujte podle těchto kroků:
-
Na stránce vyberte jednu nebo více .
-
Klikněte na analyzovat.
Otevře se okno .
-
Vyberte z rozbalovacího seznamu.
-
Pokud je to nutné, zadejte název.
-
Dostupné makra pro pojmenování analýzy:
-
{projectName} -
{sourceLang}Přidává zdrojový jazyk
-
{targetLang}Přidává cílový jazyk. Pokud je analyzováno více jazyků, jazyk bude prázdný.
-
{userName}Přidává uživatelské jméno přiřazeného překladatele nebo dodavatele. Pokud je přiřazeno více překladatelů, jméno bude prázdné.
-
{pracovní postup} -
{innerId} -
{fileName}Pokud je pro analýzu použito více souborů/zakázek,
{názevSouboru}bude prázdný.
-
-
-
Vyberte možnosti analýzy. Zejména:
-
Použití možnosti ovlivní počet slov, protože čísla nebudou počítána jako slova.
-
Možnost porovnává segmenty v analyzované zakázce na podobnosti v rámci souboru, na rozdíl od porovnávání pouze s TM.
Pokud je zaškrtnuto , shody interních fuzzy se zobrazují jako samostatná kategorie v nově vytvořených analýzách. Například:
Překladová zakázka se 10 zdrojovými slovy zahrnuje následující segmenty, kde se liší pouze poslední znak:
-
Koupil jsem nové auto.
-
Koupil jsem nové auto!
Pokud nejsou nalezeny žádné shody v TM, zobrazí se výchozí analýza:
MOŽNOSTI
Kategorie TM: 0%-49%
Kategorie TM: 95%-99%
Kategorie IF: 95%-99%
Zahrnout IF zakázáno
10 slov
Zahrnout IF povoleno + Oddělit IF zakázáno
5 slov
5 slov
Zahrnout IF + Oddělit IF povoleno
5 slov
5 slov
-
-
-
Klikněte na analyzovat.
Analýza, nebo analýzy jsou přidány do seznamu.
-
Klikněte na analýzu v seznamu, abyste ji zobrazili na stránce podrobností nebo ji stáhněte pro zpracování v aplikaci pro řízení projektů.
Poznámka
Možnosti analýzy lze nastavit při vytváření analýzy, na úrovni projektu nebo globálně v Nastavení .
Jsou poskytovány tři typy analýz:
Výchozí analýza je standardní analýza prováděná na zdrojových segmentech před překladem. Poskytuje základní analýzu zakázky, která může být použita s analýzou post-editace k určení, kolik úsilí bylo vynaloženo na překlad této zakázky. Tento základ je také použit jako základ pro generování nabídek pro klienty.
Nastavený práh TM v předpřekladu se používá jako výchozí, ale může být změněn, pokud je to nutné.
Je vyprodukován přehled počtů segmentů/slov/znaků a pokud je použit v projektu, jsou identifikovány shody TM spolu s nepřeložitelnými, interními částečnými shodami a QPS (pokud je povoleno).
Důležité
Spuštění výchozí analýzy po překladu produkuje nesprávné analýzy.
Analýza post-editace se provádí na cílových segmentech a ukazuje úsilí o editaci; kolik úsilí o editaci text vyžadoval od překladatele nebo korektora. Provádí se po dokončení post-editace.
Když překladatel klikne na nepřeložený segment, aktuální nejvyšší shoda překladové paměti, návrh strojového překladu a/nebo nepřeložitelné se uloží pro tento segment a použije se v analýze post-editace.
Analýzu post-editace lze spustit z jakékoli fáze pracovního postupu a je vypočítána jako rozdíl mezi textem vloženým z dostupného zdroje (např. TM/MT) a výsledkem po post-editaci v cílovém segmentu.
Analýza post-editace rozšiřuje tradiční analýzu překladové paměti o zahrnutí strojového překladu (MT) a nepřeložitelných (NT). MT enginy třetích stran jsou také podporovány.
Důležité
Deaktivace a nevylučuje shody TM/MT z analýzy. V tomto případě analýza zohledňuje skóre vyšší dostupné shody místo úsilí o post-editaci.
Výsledek 101% TM v analýze post-editace neznamená nutně, že segment byl přeložen z TM.
Příklad
Zakázka přeložená pomocí MT může stále vypadat jako 101% TM, pokud je deaktivována a 101% TM shoda byla dostupná, když byl segment otevřen.
Možnosti post-analýzy
Možnosti post-editace se používají k výpočtu úsilí o post-editaci potřebného pro shody z překladové paměti (TM), nepřeložitelných (NT) a strojového překladu (MT).
Analýza post-editace TM povolena
-
Určeno pro nízkokvalitní TM, které obsahují vysoké procento shod vyžadujících úpravy překladatele.
-
Indikuje úsilí o post-editaci pro TM.
-
Obsahuje pouze 100% shody v analýze. Shody 101% v kontextu z TM nemají vliv na výpočet.
Analyzovat post-editaci TM zakázáno
-
Určeno pro vysoce kvalitní TM, kde by shody měly být upravovány co nejméně, aby se snížily náklady.
-
Indikuje jak 101%, tak 100%.
-
Indikuje shody TM nabízené překladateli, když je segment otevřen (ne skutečné úsilí překladatele o post-editaci).
-
Indikuje úsilí o post-editaci pro strojový překlad a nepřekládané texty.
Analyzovat NT/MT post-editaci povoleno
-
Pokud byla akceptována návrh MT nebo NT bez další úpravy, je prezentován jako 100% shoda v analýze.
-
Pokud překladatel změní MT, míra shody bude nižší. Algoritmus pro počítání skóre je stejný jako ten, který se používá k výpočtu skóre fuzzy shod překladové paměti.
-
Úprava NT způsobí, že segment bude prezentován jako 0-49% NT.
Analyzovat NT/MT post-editaci zakázáno
-
Záznamy z MT/NT bez jakéhokoli odhadovaného skóre budou považovány za shody TM 0%-49%. Budou označeny jako přeložené překladatelem, přičemž MT nebude zohledněno.
-
QPS a Phrase Language AI shody vyšší než 75% budou v sloupci MT ve svých příslušných shodách.
-
Indikuje NT/MT shody nabízené překladateli, když je segment otevřen (ne skutečné úsilí překladatele o post-editaci).
Automaticky generovat analýzu post-editace před aktualizací zdroje
-
Analýza je vytvořena:
-
Pro každou aktualizovanou zakázku.
-
Pro každého jednotlivého poskytovatele individuálně a přiděleného k tomu příslušnému poskytovateli.
-
-
Analýza není vytvořena, pokud:
-
Není přidělen žádný překladatel nebo dodavatel.
-
-
Analýza počítá potvrzené a přeložené segmenty.
-
Analýza dodržuje pojmenovací konvenci:
-
UpdateSource #{innerID}{workflow}
-
-
Analýza bude vytvořena s Počítané jednotky (zdroj), Analyzovat NT post-editaci, Analyzovat TM post-editaci a Analyzovat MT post-editaci vybranými.
Počítat jednotky
-
Vyberte, který počet slov bude prezentován v analýze. Cílový počet slov může být vyšší než počet slov zdroje.
Nemá vliv na hodnocení shody.
-
edice Team, Ultimate a Enterprise (starší)
S dotazy ohledně licencí se obraťte na prodejce.
Funkce porovnání analýzy je k dispozici pouze v projektech s kroky pracovního postupu. Porovnává dvě verze souboru v různých krocích pracovního postupu na úrovni segmentu a analyzuje, jak se tyto dvě verze liší. Pokud neexistují specifická nastavení projektu pro analýzu, použijí se výchozí nastavení, což může vést k nesprávným zprávám.
Příklad
Analýzu lze provádět na více zakázkách a lze ji seskupit dvěma způsoby:
-
Analyzovat podle poskytovatele
-
Pro projekt s mnoha zakázkami přiřazenými různým lingvistům nebo dodavatelům. Používá se k:
-
Vytvoření samostatných analýz obsahujících soubory přiřazené jednotlivým lingvistům nebo dodavatelům.
-
Přiřadit analýzy poskytovateli, což činí analýzy viditelnými pro jejich lingvisty/dodavatele.
Schéma pro sazbu netto bude předvybráno jako možnost, pokud je aplikováno na poskytovatele.
-
-
-
Analyzovat podle jazyka
-
Pokud projekt obsahuje více cílových jazyků, analýzy všech souborů lze provádět v dávce, čímž se vytvoří samostatná analýza pro každý jednotlivý jazyk.
Pro analýzu podle jazyka postupujte podle těchto kroků:
-
Na stránce projektu vyberte všechny soubory.
-
Klikněte na analyzovat.
Otevře se okno .
-
Udržujte výchozí nastavení a vyberte .
-
Klikněte na analyzovat.
Analýza zakázky je připravena podle jazyka.
Poznámka
Zrušte výběr této možnosti pro vytvoření jedné analýzy pro vícejazyčný projekt.
-
-
Když je zdrojový soubor pro analýzu aktualizován, je označen jako zastaralý v tabulce analýz.
Přepočítání aplikuje nastavení použitá pro původní analýzu.
Dodavatelé nemají povoleno přepočítávat analýzy vytvořené Kupujícími.
Pro přepočet pomocí nového zdrojového souboru postupujte podle těchto kroků:
Přizpůsobte zobrazení analýzy
Sloupce , , , a mohou být zobrazeny/skryty v tabulce analýzy. Sloupec je také k dispozici pro analýzu post-editace a ukazuje, kolik sekund bylo stráveno úpravou segmentu.
Stáhnout analýzu
Pro stažení analýzy postupujte podle těchto kroků:
-
Klikněte na Stáhnout, abyste zobrazili rozbalovací nabídku a vyberte:
-
CSV (hodnoty oddělené čárkami) s nebo bez znaků a čitelné pomocí tabulkových aplikací.
-
LOG (podobné formátu SDL Trados) a čitelné většinou aplikací pro řízení projektů.
-
JSON (JavaScript Object Notation), lehký formát pro výměnu dat.
Pouze analýzy stažené ve formátu JSON budou zahrnovat rozpis dat NT, MT, TM a interních fuzzy (IF) podle typu shody.
-
-
Výběr typu souboru spustí stažení.
Tyto soubory mohou být importovány do většiny systémů pro řízení projektů.
Použijte schéma pro sazbu netto
Sleva na slova/znaky/stránky může být aplikována v analýze. Objem zlevněného překladu je okamžitě vypočítán a zobrazen přímo v analýze v řádku .
Chcete-li odebrat schéma pro sazbu netto z analýzy, nechte pole vedle tlačítka prázdné.
Když je schéma pro sazbu netto aplikováno na analýzu, stažený soubor s analýzou zobrazuje vážené počty slov v každé kategorii shody.
Chcete-li přiřadit analýzu poskytovateli, postupujte podle těchto kroků:
-
Vyberte analýzu ze seznamu a klikněte na Upravit.
Otevře se stránka pro úpravu.
-
Vyberte poskytovatele ze seznamu v rozbalovací nabídce.
-
Klikněte na Uložit.
Analýza bude k dispozici přiřazenému poskytovateli na portálu překladatel.