Projektový management

Segmentation Rules (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Segmentace

Segmentace je rozdělení zdrojových textů na menší části. Tím se zlepší vyhledávání dříve přeloženého textu v překladové paměti. Segmenty se zobrazují v editoru a lze je filtrovat.

Výchozí pravidla segmentace odpovídají specifikům každého podporovaného jazyka a lze je přizpůsobit.

Zakázky importované se špatnou segmentací, jako jsou špatně formátované soubory dokumentů nebo použití nevhodných úprav segmentace, mohou ovlivnit hodnoty shod TM.

Příklad:

Dobrá segmentace:

  • Překladové paměti s vícejazyčnými cílovými jazyky jsou podporovány a lze je použít obousměrně.

    Hodnota shody 100 %.

Špatná segmentace

  • Překladové paměti s vícejazyčnými jazyky cíle jsou podporovány.

    Hodnota shody 100 %.

  • a lze je použít obousměrně.

    Hodnota shody 63 %.

Upravit pravidla segmentace

Přizpůsobená pravidla segmentace lze použít na zakázky a šablony projektů. Pokud projekt vyžaduje vlastní pravidlo segmentace, bude pro něj třeba vytvořit šablonu. Pokud je nastavena jako primární, použijí se na všechny nové zakázky importované pro daný zdroj jazyk vlastní pravidla segmentace.

Existují dva typy pravidel segmentace:

  • Zkratky souboru .XLSX

  • Regulární výraz pro soubory .SRX

Chcete-li použít vlastní pravidla, stáhněte si výchozí pravidla, upravte je, nahrajte upravený soubor a použijte je na vybrané zakázky.

Pozor

Při přidávání vlastní segmentace pravidel pro zdroj jazyk CJK bez Space (zatímco cíl jazyk bude používat mezery jako oddělovač slov) zajistěte, aby byly do cíl segmentů rozdělit vlastní pravidlem přidány mezery na začátku nebo konci segmentu; to odděluje slova v překladu. V segmentech tvořených výchozími segmentace pravidly se to děje automaticky, ale v ručně rozdělit segmentech nebo segmentech tvořených dalšími vlastní segmentace pravidly nejsou přidány mezery.

Stáhnout pravidla výchozí segmentace

Chcete-li stáhnout výchozí pravidla segmentace, postupujte takto:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do oddílu Nastavení projektu a klikněte na Segmentace.

    Otevře se stránka Segmentace.

  2. Vyberte jazyk, který chcete upravit, a klikněte na Stáhnout XLSX/SRX.

    Otevře se okno Stáhnout XLSX/SRX.

  3. Vyberte formát:

    • XLSX poskytuje seznam zkratek.

    • SRX stanoví pravidla regulárních výrazů.

  4. Z rozevíracího seznamu vyberte jazyk.

  5. Klikněte na Stáhnout.

    Soubor se stáhne do vašeho systému.

Chcete-li stáhnout dříve nahrané pravidlo pro segmentaci, které jste již nahráli, postupujte takto:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do oddílu Nastavení projektu a klikněte na Segmentace.

    Otevře se stránka Segmentace.

  2. Klikněte na ikonu Nastavení vpravo a zvolte Upravit sloupce: customize-segmentation-columns.png

  3. Povolit sloupec Název souboru

  4. Kliknutím na název souboru si stáhnete předuložené pravidlo.

Upravit zkratky v souboru .XLSX

Pro jednotlivé jazyky lze určit zkratky, po kterých se nemají vytvářet nové segmenty.

Zkratky můžete upravit takto:

  1. Otevřete stažený soubor .XLSX v editoru.

  2. Změňte obsah následujícím formátováním:

    Soubor XLSX musí mít dva sloupce bez záhlaví.

    • Sloupec 1: Upřesní se zkratka

    • Sloupec 2: Specifikace chování segmentace

      • ABBR_UPPER_NUM

        Nový segment se nemůže vytvořit, pokud za zkratkou následuje white-Space a poté číslo, symbol (matematika, měnové znaky, dingbats atd.) nebo slovo s velkým písmenem.

      • ABBR_NUM

        Nový segment není vytvořen, pokud po zkratce následuje white-Space a pak číslo.

  3. Uložte upravený soubor .XLSX.

Upravit regulární výrazy v souboru .SRX

Editace souborů .SRX je složitý proces vhodný pouze pro uživatele, kteří mají zkušenosti s používáním regulárních výrazů

V souboru SRX lze změnit několik pravidel:

  • Import textu ze souboru XLSX bez segmentace; jedna buňka se rovná jednomu segmentu.

  • Import textu s novým řádkem s objednávkou rozdělit jeden segment na dva.

  • Jako oddělovač segmentů použijte dvojtečku (nebo jiný znak).

  • Zakažte použít středník (nebo jiný znak) jako oddělovač segmentů.

  • Odebírání zkratky ze seznamu (text bude segmentován).

Tato pravidla jsou založena na znacích; jako oddělovač segmentů lze použít pouze jeden znak. Skupiny znaků (např.: <p>) nelze použít jako oddělovač segmentů.

Soubor SRX upravíte takto:

  1. Otevřete soubor v textovém editoru, jako je Poznámkový blok ++.

  2. Upravit pomocí regulárních výrazů nebo zcela odebrat vnitřní segmentaci.

    Příklad:

    BreakRules_Example.png
    • <rule break="ne">

      Seznam pravidel, ve kterých nebude segment zalomený. Tj. seznam zkratek

    • <pravidlo> <před přestávkou>

      Regulární výraz pro znak před zalomením (např. na konci věty „. ? ! :“). Pokud například nechcete text segmentu po dvojtečce, jednoduše odstraňte : z každého kódu <pravidla><před zalomením>.

    • <rule> <afterbreak>

      Regulární výraz pro znak po zalomení (například na začátku nové věty; Space a velké písmeno).

  3. Uložit upravený soubor SRX.

Nahrát nová pravidla pro segmentaci

Upravená nebo nová pravidla segmentace nahrajete takto:

  1. Na stránce Nastavení Setup_gear.png přejděte dolů do oddílu Nastavení projektu a klikněte na Segmentace.

    Otevře se stránka Segmentace.

  2. Klikněte na Nový.

    Otevře se stránka Nahrát vlastní soubor s pravidly segmentace ve formátu XLSX nebo SRX.

  3. Z rozevíracího seznamu vyberte jazyk.

  4. Zadejte název pravidla.

  5. Klikněte na Vybrat soubor.

    Otevře se okno pro výběr souboru.

  6. Vyberte soubor upravených pravidel, který chcete nahrát.

  7. Zaškrtněte položku Primární, zda budou primárními pravidly segmentace pro vybraný jazyk vlastní pravidla segmentace.

  8. Klikněte na Vytvořit.

    Otevře se stránka Segmentace a pravidlo bylo přidáno do seznamu.

Použít vlastní pravidla segmentace pro import zakázek

Chcete-li použít vlastní pravidla pro import zakázky, postupujte takto:

  1. Ve fázi 8 vytvoření zakázky klikněte v nastavení importu souboru na položku Segmentace a délka segmentu.

    Otevře se rozevírací seznam možností Segmentace a délka segmentu.

  2. Vyberte změněná pravidla z rozevíracího seznamu Pravidla segmentace zdroje.

  3. Klikněte na Vytvořit.

    Zakázka je vytvořena a přidána do seznamu podle zadaných pravidel segmentace.

Příklad změny segmentace (1 buňka 1 segment)

Odebrat všechna vnitřní pravidla pro segmentaci ze souboru SRX a ponechat pouze základní segmentaci celého použitého odstavce, elementu nebo buňky. Toto pravidlo segmentace lze použít pro všechny typy souborů (MS Word, XML, HTML, Excel atd.).

Příklad:

A

B

1

Petere! Počkej!

2

Dobrý den.

3

Tento příklad XLSX importovaný s výchozí segmentací bude mít 3 segmenty: Petere!, Počkej! a Ahoj.

Pokud je odstraněna veškerá vnitřní segmentace a ponechána pouze základní segmentace založená na buňce, pak existují pouze dva segmenty: Petere! Počkejte! a ahoj.

Upravit soubor SRX a odebrat všechna výchozí pravidla segmentace, tj. kód mezi <!-- porušení pravidel --> a </languagerule>.

Příklad:

1cell-1segment-srx.png

Kaskádování může způsobit, že tento příklad nebude zakázku. V tom případě otevřete upravený soubor SRX v programu Notepad ++, najděte dva atributy elementu záhlaví a změňte oba na ne.

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.