Pokyny pro výběr překladové paměti
Phrase Custom AI využívá překladové paměti (TMS) k vytvoření vlastních modelů strojového překladu (MT), které dodržují konkrétní terminologii a styl, což vede ke zlepšení kvality překladu (a tím ke snížení doby post-editace) těchto typů obsahu ve srovnání s obecným strojovým překladem.
Nejdůležitějším faktorem, který může ovlivnit efektivitu procesu přizpůsobení, jsou použité překladové paměti. Toto jsou obecné pokyny, které vám Nápověda určit, jaká data použít k tomuto účelu:
-
Jedna doména:
Nejlepší je, když se datová sada zaměřuje na obsah zahrnující jeden styl a terminologii. Pokud datová sada obsahuje kombinaci domén (např. právní termíny webových stránek i popisy produktů), model se může dozvědět, jaký je požadovaný styl.
-
Unikátní typ obsahu:
Vlastní model MT vychází z obecných modelů natrénovaných na obrovském množství veřejných dat získaných z internetu. Pokud překladová paměť obsahuje data, která jsou zcela podobná obecným datům použitým při sestavování generických modelů, nebude možné z procesu přizpůsobení mnoho získat.
-
Kvalita dat:
Model bude předpokládat, že každá dvojice vět v překladové paměti je příkladem výstupu, který se očekává. Překladová paměť musí být kvalitní, ideálně vytvořená z Professional Human Translations. Potrubí pro čištění dat může Nápověda filtrovat nejškodlivější části datové sady.
-
Očekávaný objem:
Aby bylo přizpůsobení účinné z hlediska návratnosti investic, musí datová sada představovat většinu dat, kde bude mít kvalita MT větší vliv. Například, pokud má být část výstupu MT post-editována lidskými překladateli, aby se maximalizovala návratnost investic, musí data představovat obsah, který bude post-editován.
Datovou sadu vytvoříte takto:
-
Klikněte na + Nová datová sada.
Otevře se stránka
. -
Zadejte název datové sady.
-
Přepínače jazyků umožňují různé možnosti:
-
Chcete-li vytvořit obecnou datovou sadu jazyků, vyberte stejné zdrojové a cílové jazyky ve voličích jazyka a kódu jazyka.
-
Chcete-li vytvořit datovou sadu pro kód jazyka, vyberte z prvního rozevíracího seznamu zdrojový jazyk a cíl a z druhého rozevíracího seznamu určete kódy zdrojového jazyka a cíle.
Lze také přidat více kódů jazyků cíle pro využití více zdrojů dat.
-
Chcete-li vytvořit datovou sadu s více kódy jazyků zdroje a cíle, vyberte z prvního rozevíracího seznamu zdrojový jazyk a cíl, z druhého rozevíracího seznamu zadejte kódy jazyků zdroje a cíle (lze přidat více kódů jazyků cíle) a klikněte na + Přidat další páry kódů jazyků.
Zobrazí se okno
. -
-
Klikněte na Přidat překladové paměti.
Otevře se stránka
s funkcí . -
Chcete-li Přidat TM do datové sady, klikněte na ikonu . TM se přidá do sloupce
.Více TMS lze přidat maximálně 10 a datová sada by měla ideálně obsahovat alespoň 10 000 segmentů.
Kliknutím na název TM se výběr zobrazí na stránce překladové paměti.
Kliknutím na ikonu odeberte TM ze sloupce
. -
Klikněte na Uložit.
Otevře se stránka
. -
Zkontrolujte uvedené podrobnosti a pokud jsou správné, klikněte na Pokračovat.
Otevře se stránka
. -
Použijte požadované filtry a klikněte na Vytvořit.
Datová sada se vytvoří a přidá do seznamu na stránce
s výchozím stavem .