Pokyny pro výběr překladové paměti
Phrase Custom AI využívá překladové paměti ((TMS)) k vytvořit vlastní modelů strojový překlad (MT), které dodržují konkrétní terminologii a styl, což vede ke zlepšení kvality překladu (a tím ke snížení doby post-editace) těchto typů obsah ve srovnání s obecným strojový překlad.
Nejdůležitějším faktorem, který může ovlivnit efektivitu procesu přizpůsobení, jsou použité překladové paměti. Toto jsou obecné pokyny, které mohou Nápověda určit, jaká data použít pro tento účel:
-
Jedna doména:
Nejlepší je, když se datová sada zaměřuje na obsah zahrnující jeden styl a terminologii. Pokud datová sada obsahuje směs domén (např. jak právní termíny webových stránek, tak popisy produktů), model se nemůže dozvědět, jaký je požadovaný styl.
-
Jedinečný typ obsahu:
Vlastní model MT vychází z generických modelů trénovaných na obrovském množství veřejných dat získaných z internetu. Pokud překladová paměť obsahuje data, která jsou velmi podobná obecným datům použitým při sestavování generických modelů, nebude toho z procesu přizpůsobení mnoho.
-
Kvalita dat:
Model bude předpokládat, že každá dvojice vět v překladová paměť je příkladem výstup, který se očekává. překladová paměť musí být kvalitní, ideálně vytvořená z Professional lidských překladů. Kanál pro čištění dat může Nápověda filtrovat nejškodlivější části datové sady.
-
Očekávaný objem:
Aby bylo přizpůsobení z hlediska návratnosti investic efektivní, musí datová sada představovat většinu dat, kde bude mít kvalita MT větší vliv. Například, pokud má být část výstupu MT post-editace lidskými překladateli, aby se maximalizovala návratnost investic, musí data představovat obsah, který bude post-editace.
Chcete-li vytvořit datovou sadu pro účely trénování vlastního nástroje MT, postupujte takto:
-
Na stránce Trénovat vlastní nástroj MT.
klikněte naOtevře se stránka
. -
Zadejte název datové sady.
-
Přepínače jazyků umožňují různé možnosti:
-
Chcete-li vytvořit datovou sadu obecných jazyků, vyberte v voličích jazyka a kódu jazyka stejné jazyky zdroje a cíle.
-
Chcete-li vytvořit datovou sadu specifickou pro kód jazyka, vyberte z prvního rozevíracího seznamu jazyky zdroje a cíle a z druhého rozevíracího seznamu určete kódy zdroje a cíle.
Lze také přidat více kódů jazyků cíle pro využití více zdrojů dat.
-
Chcete-li vytvořit datovou sadu s více kódy jazyků zdroje a cíle, vyberte z prvního rozevíracího seznamu jazyky zdroje a cíle, z druhého rozevíracího seznamu určete kódy jazyků zdroje a cíle (lze přidat více kódů jazyků cíle) a klikněte na tlačítko + Přidat další páry kódů jazyků.
Zobrazí se okno
. -
-
Klikněte na Přidat překladové paměti.
Otevře se stránka
spro vyhledávání.
-
Chcete-li přidat TM do datové sady, klikněte na ikonu
. TM se přidá do sloupce .
Více TMS lze přidat maximálně do 200 a datová sada by měla ideálně obsahovat alespoň 10 000 segmentů.
Kliknutím na název TM se výběr zobrazí na stránce překladové paměti.
Kliknutím na ikonu
odeberte TM ze sloupce .
-
Klikněte na Uložit.
Otevře se stránka
. -
Zkontrolujte prezentované údaje a pokud jsou správné, klikněte na Pokračovat.
Otevře se stránka
. -
Použijte požadované filtry a klikněte na Vytvořit.
Datová sada se vytvoří a přidá do seznamu na stránce
s výchozím stavem a stavem ve sloupci .
Časté chyby:
-
400 Neplatná hodnota
Tato Error se může objevit při výběru nepodporovaných jazyků v datových sadách. Custom AI je založena na Phrase NextMT a podporuje pouze jazyky dostupné ve Phrase NextMT.