Custom AI

Create a Dataset

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Pokyny pro výběr překladové paměti

Phrase Custom AI využívá překladové paměti ((TMS)) k vytvořit vlastní modelů strojový překlad (MT), které dodržují konkrétní terminologii a styl, což vede ke zlepšení kvality překladu (a tím ke snížení doby post-editace) těchto typů obsah ve srovnání s obecným strojový překlad.

Nejdůležitějším faktorem, který může ovlivnit efektivitu procesu přizpůsobení, jsou použité překladové paměti. Toto jsou obecné pokyny, které mohou Nápověda určit, jaká data použít pro tento účel:

  • Jedna doména:

    Nejlepší je, když se datová sada zaměřuje na obsah zahrnující jeden styl a terminologii. Pokud datová sada obsahuje směs domén (např. jak právní termíny webových stránek, tak popisy produktů), model se nemůže dozvědět, jaký je požadovaný styl.

  • Jedinečný typ obsahu:

    Vlastní model MT vychází z generických modelů trénovaných na obrovském množství veřejných dat získaných z internetu. Pokud překladová paměť obsahuje data, která jsou velmi podobná obecným datům použitým při sestavování generických modelů, nebude toho z procesu přizpůsobení mnoho.

  • Kvalita dat:

    Model bude předpokládat, že každá dvojice vět v překladová paměť je příkladem výstup, který se očekává. překladová paměť musí být kvalitní, ideálně vytvořená z Professional lidských překladů. Kanál pro čištění dat může Nápověda filtrovat nejškodlivější části datové sady.

  • Očekávaný objem:

    Aby bylo přizpůsobení z hlediska návratnosti investic efektivní, musí datová sada představovat většinu dat, kde bude mít kvalita MT větší vliv. Například, pokud má být část výstupu MT post-editace lidskými překladateli, aby se maximalizovala návratnost investic, musí data představovat obsah, který bude post-editace.

Chcete-li vytvořit datovou sadu pro účely trénování vlastního nástroje MT, postupujte takto:

  1. Na stránce Datové sady klikněte na Trénovat vlastní nástroj MT.

    Otevře se stránka Údaje datové sady.

  2. Zadejte název datové sady.

  3. Přepínače jazyků umožňují různé možnosti:

    1. Chcete-li vytvořit datovou sadu obecných jazyků, vyberte v voličích jazyka a kódu jazyka stejné jazyky zdroje a cíle.

    2. Chcete-li vytvořit datovou sadu specifickou pro kód jazyka, vyberte z prvního rozevíracího seznamu jazyky zdroje a cíle a z druhého rozevíracího seznamu určete kódy zdroje a cíle.

      Lze také přidat více kódů jazyků cíle pro využití více zdrojů dat.

    3. Chcete-li vytvořit datovou sadu s více kódy jazyků zdroje a cíle, vyberte z prvního rozevíracího seznamu jazyky zdroje a cíle, z druhého rozevíracího seznamu určete kódy jazyků zdroje a cíle (lze přidat více kódů jazyků cíle) a klikněte na tlačítko + Přidat další páry kódů jazyků.

    Zobrazí se okno Vstupní data.

  4. Klikněte na Přidat překladové paměti.

    Otevře se stránka Vybrat překladové paměti s search.jpg pro vyhledávání.

  5. Chcete-li přidat TM do datové sady, klikněte na ikonu AddTM.jpg. TM se přidá do sloupce Vybráno.

    Více TMS lze přidat maximálně do 200 a datová sada by měla ideálně obsahovat alespoň 10 000 segmentů.

    Kliknutím na název TM se výběr zobrazí na stránce překladové paměti.

    Kliknutím na ikonu RemoveTM.jpg odeberte TM ze sloupce Vybrané.

  6. Klikněte na Uložit.

    Otevře se stránka Údaje datové sady.

  7. Zkontrolujte prezentované údaje a pokud jsou správné, klikněte na Pokračovat.

    Otevře se stránka Filtry čištění.

  8. Použijte požadované filtry a klikněte na Vytvořit.

    Datová sada se vytvoří a přidá do seznamu na stránce Datové sady s výchozím stavem Čištění a stavem Training MT ve sloupci Vytvořeno pro.

Časté chyby:

  • 400 Neplatná hodnota

    Tato Error se může objevit při výběru nepodporovaných jazyků v datových sadách. Custom AI je založena na Phrase NextMT a podporuje pouze jazyky dostupné ve Phrase NextMT.

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.