Custom AI

Vytvořit datovou sadu

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Pokyny pro výběr překladové paměti

Phrase Custom AI využívá překladové paměti (TMS) k vytvoření vlastních modelů strojového překladu (MT), které dodržují konkrétní terminologii a styl, což vede ke zlepšení kvality překladu (a tím ke snížení doby post-editace) těchto typů obsahu ve srovnání s obecným strojovým překladem.

Nejdůležitějším faktorem, který může ovlivnit efektivitu procesu přizpůsobení, jsou použité překladové paměti. Toto jsou obecné pokyny, které vám Nápověda určit, jaká data použít k tomuto účelu:

  • Jedna doména:

    Nejlepší je, když se datová sada zaměřuje na obsah zahrnující jeden styl a terminologii. Pokud datová sada obsahuje kombinaci domén (např. právní termíny webových stránek i popisy produktů), model se může dozvědět, jaký je požadovaný styl.

  • Unikátní typ obsahu:

    Vlastní model MT vychází z obecných modelů natrénovaných na obrovském množství veřejných dat získaných z internetu. Pokud překladová paměť obsahuje data, která jsou zcela podobná obecným datům použitým při sestavování generických modelů, nebude možné z procesu přizpůsobení mnoho získat.

  • Kvalita dat:

    Model bude předpokládat, že každá dvojice vět v překladové paměti je příkladem výstupu, který se očekává. Překladová paměť musí být kvalitní, ideálně vytvořená z Professional Human Translations. Potrubí pro čištění dat může Nápověda filtrovat nejškodlivější části datové sady.

  • Očekávaný objem:

    Aby bylo přizpůsobení účinné z hlediska návratnosti investic, musí datová sada představovat většinu dat, kde bude mít kvalita MT větší vliv. Například, pokud má být část výstupu MT post-editována lidskými překladateli, aby se maximalizovala návratnost investic, musí data představovat obsah, který bude post-editován.

Datovou sadu vytvoříte takto:

  1. Klikněte na + Nová datová sada.

    Otevře se stránka s údaji datové sady.

  2. Zadejte název datové sady.

  3. Přepínače jazyků umožňují různé možnosti:

    1. Chcete-li vytvořit obecnou datovou sadu jazyků, vyberte stejné zdrojové a cílové jazyky ve voličích jazyka a kódu jazyka.

    2. Chcete-li vytvořit datovou sadu pro kód jazyka, vyberte z prvního rozevíracího seznamu zdrojový jazyk a cíl a z druhého rozevíracího seznamu určete kódy zdrojového jazyka a cíle.

      Lze také přidat více kódů jazyků cíle pro využití více zdrojů dat.

    3. Chcete-li vytvořit datovou sadu s více kódy jazyků zdroje a cíle, vyberte z prvního rozevíracího seznamu zdrojový jazyk a cíl, z druhého rozevíracího seznamu zadejte kódy jazyků zdroje a cíle (lze přidat více kódů jazyků cíle) a klikněte na + Přidat další páry kódů jazyků.

    Zobrazí se okno Zdroje dat.

  4. Klikněte na Přidat překladové paměti.

    Otevře se stránka Vybrat překladové paměti s funkcí Vyhledat.jpg.

  5. Chcete-li Přidat TM do datové sady, klikněte na ikonu AddTM.jpg. TM se přidá do sloupce Vybraný.

    Více TMS lze přidat maximálně 10 a datová sada by měla ideálně obsahovat alespoň 10 000 segmentů.

    Kliknutím na název TM se výběr zobrazí na stránce překladové paměti.

    Kliknutím na ikonu OdebratTM.jpg odeberte TM ze sloupce Vybraný.

  6. Klikněte na Uložit.

    Otevře se stránka s údaji datové sady.

  7. Zkontrolujte uvedené podrobnosti a pokud jsou správné, klikněte na Pokračovat.

    Otevře se stránka Filtry čištění.

  8. Použijte požadované filtry a klikněte na Vytvořit.

    Datová sada se vytvoří a přidá do seznamu na stránce Datové sady s výchozím stavem čištění.

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.