Projektový management

Pravidla segmentace (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Segmentace

Segmentace je rozdělení zdrojových textů na menší části. To zlepšuje vyhledávání dříve přeloženého textu z překladové paměti. Segmenty jsou prezentovány v editoru a mohou být filtrovány. Pokud má projekt pracovní postupy, změny v segmentech jsou prezentovány v okně změn překladu.

Výchozí pravidla segmentace odpovídají specifikům každého podporovaného jazyka a mohou být přizpůsobena.

Úkoly importované s špatnou segmentací, jako jsou špatně formátované dokumenty nebo použití nevhodného přizpůsobení segmentace, mohou ovlivnit hodnoty shody TM. Doporučuje se strávit nějaký čas revizí a přípravou zdrojového souboru před importem; běžným problémem je nesprávné použití zalomení řádků versus zalomení odstavců.

Příklad:

Dobrá segmentace:

  • Překladové paměti s vícejazyčnými cílovými jazyky jsou podporovány a mohou být použity obousměrně.

    Hodnota shody 100%.

Špatná segmentace

  • Překladové paměti s vícejazyčnými cílovými jazyky jsou podporovány.

    Hodnota shody 100%.

  • a mohou být použity obousměrně.

    Hodnota shody 63%.

Přizpůsobit pravidla segmentace

Přizpůsobená pravidla segmentace mohou být aplikována na úkoly a šablony projektů. Pokud projekt vyžaduje přizpůsobené pravidlo segmentace, bude třeba vytvořit šablonu pro tento projekt. Pokud je nastaveno jako primární, přizpůsobená pravidla segmentace se aplikují na všechny nové úkoly importované pro daný zdrojový jazyk.

Existují dva typy pravidel segmentace:

  • Zkratky do souboru .XLSX

  • Regulární výraz souborů .SRX

Chcete-li použít přizpůsobená pravidla, stáhněte výchozí pravidla, upravte je, nahrajte upravený soubor a poté je aplikujte na určené úkoly.

Pozor

Při přidávání vlastních pravidel segmentace pro jazyk CJK bez mezer (zatímco cílový jazyk bude používat mezery jako oddělovač slov) zajistěte, aby byly k cílovým segmentům rozděleným podle vlastního pravidla přidány vedoucí nebo koncové mezery; to odděluje slova v překladu. Zatímco se to automaticky děje v segmentech vytvořených výchozími pravidly segmentace, žádné mezery nejsou přidány v ručně rozdělených segmentech nebo těch vytvořených dalšími vlastními pravidly segmentace.

Stáhnout výchozí pravidla segmentace

Chcete-li stáhnout výchozí pravidla segmentace, postupujte podle těchto kroků:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do sekce Nastavení projektu a klikněte na Segmentace.

    Otevře se stránka Segmentace.

  2. Vyberte jazyk, který má být přizpůsoben, a klikněte na Export XLSX/SRX.

    Otevře se okno Export XLSX/SRX.

  3. Vyberte formát:

    • XLSX poskytuje seznam zkratek.

    • SRX poskytuje pravidla regulárního výrazu.

  4. Vyberte jazyk ze seznamu rozbalovacího menu.

  5. Klikněte na Stáhnout.

    Soubor je stažen do vašeho systému.

Chcete-li stáhnout dříve nahrané pravidlo segmentace, které jste nahráli dříve, postupujte podle těchto kroků:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do sekce Nastavení projektu a klikněte na Segmentace.

    Otevře se stránka Segmentace.

  2. Klikněte na ikonu nastavení vpravo a vyberte Upravit sloupce: customize-segmentation-columns.png

  3. Povolit sloupec název souboru

  4. Klikněte na název souboru pro stažení předem uloženého pravidla.

Upravit zkratky v souboru .XLSX

Zkratky mohou být specifikovány pro jednotlivé jazyky, po kterých by neměly být vytvářeny nové segmenty.

Chcete-li upravit zkratky, postupujte podle těchto kroků:

  1. Otevřete stažený soubor .XLSX v editoru.

  2. Změňte obsah podle následujícího formátování:

    Soubor XLSX musí mít dva sloupce bez záhlaví.

    • Sloupec 1: Zkratka, která má být specifikována

    • Sloupec 2: Specifikace chování segmentace

      • ABBR_UPPER_NUM

        Nový segment nebude vytvořen, pokud je zkratka následována mezerou a poté číslem, symbolem (matematické, měnové značky, dingbats atd.) nebo slovem s prvním písmenem velkým.

      • ABBR_NUM

        Nový segment nebude vytvořen, pokud je zkratka následována mezerou a poté číslem.

  3. Uložte upravený soubor .XLSX.

Upravit regulární výrazy v souboru .SRX

Úprava souborů .SRX je složitý proces vhodný pouze pro uživatele zkušené v používání regulárních výrazů

Existuje několik pravidel, která lze změnit v souboru SRX:

  • Importovat text z XLSX souboru bez segmentace; jedna buňka se rovná jednomu segmentu.

  • Importovat text s novým řádkem, aby se jeden segment rozdělil na dva.

  • Použijte dvojtečku (nebo jakýkoli jiný znak) jako oddělovač segmentů.

  • Zakázat použití středníku (nebo jakéhokoli jiného znaku) jako oddělovače segmentů.

  • Odebrání zkratky ze seznamu (text bude segmentován).

Tato pravidla jsou na základě znaků; může být použit pouze jeden znak jako oddělovač segmentů. Skupiny znaků (například: <p>) nemohou být použity jako oddělovač segmentů.

Chcete-li upravit soubor SRX, postupujte podle těchto kroků:

  1. Otevřete soubor v textovém editoru, jako je Notepad ++.

  2. Upravte pomocí regulárních výrazů nebo zcela odstraňte vnitřní segmentaci.

    Příklad:

    BreakRules_Example.png
    • <rule break="no">

      Seznam pravidel, kde segment nebude přerušen. Tedy seznam zkratek

    • <rule> <beforebreak>

      Regulární výraz pro znak před přerušením (například na konci věty ". ? ! :"). Pokud například nechcete segmentovat text po dvojtečce, jednoduše odstraňte : z každého <rule><beforebreak> kódu.

    • <rule> <afterbreak>

      Regulární výraz pro znak po přerušení (například na začátku nové věty; mezera a velké písmeno).

  3. Uložte upravený soubor SRX.

Chcete-li nahrát upravená nebo nová pravidla segmentace, postupujte podle těchto kroků:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do sekce Nastavení projektu a klikněte na Segmentaci.

    Otevře se stránka Segmentace.

  2. Klikněte na Nový.

    Otevře se stránka Nahrát vlastní soubor segmentace XLSX nebo SRX.

  3. Vyberte Jazyk z rozbalovacího seznamu.

  4. Uveďte Název pro pravidlo.

  5. Klikněte na Vybrat soubor.

    Otevře se okno pro výběr souboru.

  6. Vyberte upravený soubor pravidel pro nahrání.

  7. Zaškrtněte Primární, pokud budou vlastní pravidla segmentace primárními pravidly segmentace pro vybraný jazyk.

  8. Klikněte na Vytvořit.

    Otevře se stránka Segmentace a pravidlo bylo přidáno do seznamu.

Použít vlastní pravidla segmentace při importu zakázky

Chcete-li použít vlastní pravidla při importu zakázky nebo nakonfigurovat cílovou délku segmentu, postupujte podle těchto kroků:

  1. V kroku 8 vytváření zakázky klikněte na Segmentaci a délku segmentu v Nastavení importu souboru.

    Otevře se rozbalovací nabídka Možnosti segmentace a délky segmentu.

  2. Vyberte upravená pravidla z rozbalovacího seznamu Pravidla segmentace zdroje.

  3. Volitelně nakonfigurujte limit pro cílovou délku segmentu na základě požadavků projektu (např. překlad titulků):

    • Vyberte Max. cílová délka segmentu v % zdroje a zadejte preferované procento pro omezení délky segmentu na základě segmentu zdroje.

    • Vyberte Max. cílová délka segmentu v znacích a zadejte počet znaků pro omezení délky segmentu podle počtu znaků.

  4. Klikněte na Vytvořit.

    Zakázka je vytvořena a přidána do seznamu pomocí specifikovaných pravidel segmentace.

Příklad změny segmentace (1 buňka 1 segment)

Odeberte všechna vnitřní pravidla segmentace ze souboru SRX a ponechte pouze základní segmentaci celého odstavce, prvku nebo buňky. Toto pravidlo segmentace lze aplikovat na každý typ souboru (MS Word, XML, HTML, Excel atd.).

Příklad:

A

B

1

Petře! Počkej!

2

Ahoj.

3

Tento příklad XLSX importovaný s výchozí segmentací bude mít 3 segmenty: Petře!, Počkej! a Ahoj.

Pokud je odstraněna veškerá vnitřní segmentace a ponechána pouze základní segmentace na základě buňky, pak jsou pouze dva segmenty: Petře! Počkej! a Ahoj.

Upravte soubor SRX, abyste odstranili všechna výchozí pravidla segmentace, tj. kód mezi <!-- break rules --> a </languagerule>.

Příklad:

1cell-1segment-srx.png

Kaskádování může způsobit, že tento příklad nebude fungovat. V takovém případě otevřete upravený soubor SRX v Notepad++, najděte dva atributy prvku header a změňte oba na ne.

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.