Projektmanagement

Segmentierungsregeln (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Segmentierung

Die Segmentierung ist das Aufteilen von Quelltexten in kleinere Teile. Dies verbessert das Abrufen von zuvor übersetztem Text aus einem Translation Memory. Segmente werden im Editor präsentiert und können gefiltert werden. Wenn ein Projekt Workflow-Schritte hat, werden Änderungen in den Segmenten im Bereich für Übersetzungsänderungen angezeigt.

Standard-Segmentierungsregeln entsprechen den Besonderheiten jeder unterstützten Sprache und können angepasst werden.

Jobs, die mit schlechter Segmentierung importiert werden, wie schlecht formatierte Dokumentdateien oder die Anwendung unangemessener Segmentierungsanpassungen, können die TM-Match-Werte beeinflussen. Es wird empfohlen, etwas Zeit mit der Überprüfung und Vorbereitung der Quelldatei vor der Importierung zu verbringen; ein häufiges Problem ist die falsche Verwendung von Zeilenumbrüchen im Vergleich zu Absatzumbrüchen.

Beispiel:

Gute Segmentierung:

  • Translation Memorys mit mehrsprachigen Zielsprache werden unterstützt und können bidirektional verwendet werden.

    Match-Wert von 100%.

Schlechte Segmentierung

  • Translation Memorys mit mehrsprachigen Zielsprache werden unterstützt.

    Match-Wert von 100%.

  • und können bidirektional verwendet werden.

    Match-Wert von 63%.

Segmentierungsregeln anpassen

Angepasste Segmentierungsregeln können auf Jobs und Projektvorlagen angewendet werden. Wenn ein Projekt eine angepasste Segmentierungsregel erfordert, muss eine Vorlage für dieses Projekt erstellt werden. Wenn als primär festgelegt, werden benutzerdefinierte Segmentierungsregeln auf alle neuen Aufträge angewendet, die für diese Ausgangssprache importiert werden.

Es gibt zwei Arten von Segmentierungsregeln:

  • Abkürzungen für die .XLSX-Datei

  • Regulärer Ausdruck der .SRX-Dateien

Um benutzerdefinierte Regeln zu verwenden, laden Sie die Standardregeln herunter, ändern Sie diese, laden Sie die modifizierte Datei hoch und wenden Sie sie dann auf die angegebenen Aufträge an.

Vorsicht

Wenn Sie benutzerdefinierte Segmentierungsregeln für eine sprachlose CJK-Ausgangssprache hinzufügen (während eine Zielsprache Leerzeichen als Worttrennzeichen verwendet), stellen Sie sicher, dass führende oder nachfolgende Leerzeichen zu den Zielsegmenten hinzugefügt werden, die durch die benutzerdefinierte Regel aufgeteilt werden; dies trennt die Wörter in der Übersetzung. Während dies automatisch in Segmenten geschieht, die durch die Standard-Segmentierungsregeln gebildet werden, werden in manuell aufgeteilten Segmenten oder solchen, die durch zusätzliche benutzerdefinierte Segmentierungsregeln gebildet werden, keine Leerzeichen hinzugefügt.

Standard-Segmentierungsregeln herunterladen

Um die Standard-Segmentierungsregeln herunterzuladen, befolgen Sie diese Schritte:

  1. Gehen Sie auf die Seite Einstellungen Setup_gear.png, scrollen Sie nach unten zum Abschnitt Projekteinstellungen und klicken Sie auf Segmentierung.

    Die Seite Segmentierung öffnet sich.

  2. Wählen Sie die Sprache aus, die angepasst werden soll, und klicken Sie auf Export XLSX/SRX.

    Das Fenster Export XLSX/SRX öffnet sich.

  3. Format auswählen:

    • XLSX bietet eine Abkürzungsliste.

    • SRX bietet Regeln für reguläre Ausdrücke.

  4. Wählen Sie eine Sprache aus der Dropdown-Liste aus.

  5. Klicken Sie auf Herunterladen.

    Die Datei wird auf Ihr System heruntergeladen.

Um eine zuvor hochgeladene Segmentierungsregel herunterzuladen, die Sie zuvor hochgeladen haben, befolgen Sie diese Schritte:

  1. Gehen Sie auf die Seite Einstellungen Setup_gear.png, scrollen Sie nach unten zum Abschnitt Projekteinstellungen und klicken Sie auf Segmentierung.

    Die Seite Segmentierung öffnet sich.

  2. Klicken Sie auf das Einstellungen-Symbol auf der rechten Seite und wählen Sie Spalten anpassen: customize-segmentation-columns.png

  3. Aktivieren Sie die Dateiname-Spalte

  4. Klicken Sie auf einen Dateinamen, um eine zuvor gespeicherte Regel herunterzuladen.

Abkürzungen in einer .XLSX-Datei bearbeiten

Abkürzungen können für einzelne Sprachen angegeben werden, nach denen keine neuen Segmente erstellt werden sollten.

Um Abkürzungen zu bearbeiten, befolgen Sie diese Schritte:

  1. Öffnen Sie die heruntergeladene .XLSX-Datei in einem Editor.

  2. Ändern Sie den Inhalt mit der folgenden Formatierung:

    Die XLSX-Datei muss zwei Spalten ohne Überschriften haben.

    • Spalte 1: Abkürzung, die angegeben werden soll

    • Spalte 2: Spezifikation des Segmentierungsverhaltens

      • ABBR_UPPER_NUM

        Ein neues Segment wird nicht erstellt, wenn die Abkürzung von einem Leerzeichen und dann von einer Zahl, einem Symbol (Mathematik, Währungssymbole, Dingbats usw.) oder einem Wort mit dem ersten Buchstaben in Großbuchstaben gefolgt wird.

      • ABBR_NUM

        Ein neues Segment wird nicht erstellt, wenn die Abkürzung von einem Leerzeichen und dann von einer Zahl gefolgt wird.

  3. Speichern Sie die bearbeitete .XLSX-Datei.

Reguläre Ausdrücke in einer .SRX-Datei bearbeiten

Das Bearbeiten von .SRX-Dateien ist ein komplexer Prozess, der nur für Benutzer geeignet ist, die Erfahrung im Umgang mit regulären Ausdrücken haben.

Es gibt mehrere Regeln, die in einer SRX-Datei geändert werden können:

  • Importieren Sie Text aus einer XLSX-Datei ohne Segmentierung; eine Zelle entspricht einem Segment.

  • Importieren Sie den Text mit einer neuen Zeile, um ein Segment in zwei zu teilen.

  • Verwenden Sie einen Doppelpunkt (oder ein anderes Zeichen) als Segmenttrennzeichen.

  • Verbot der Verwendung eines Semikolons (oder eines anderen Zeichens) als Segmenttrennzeichen.

  • Entfernen Sie eine Abkürzung aus der Liste (der Text wird segmentiert).

Diese Regeln sind zeichenbasiert; nur ein einzelnes Zeichen kann als Segmenttrennzeichen verwendet werden. Gruppen von Zeichen (zum Beispiel: <p>) können nicht als Segmenttrennzeichen verwendet werden.

Um eine SRX-Datei zu bearbeiten, befolgen Sie diese Schritte:

  1. Öffnen Sie die Datei in einem Texteditor wie Notepad ++.

  2. Bearbeiten Sie mit regulären Ausdrücken oder entfernen Sie die innere Segmentierung vollständig.

    Beispiel:

    BreakRules_Example.png
    • <regel break="no">

      Die Liste der Regeln, bei denen das Segment nicht unterbrochen wird. d.h. eine Liste von Abkürzungen

    • <rule> <beforebreak>

      Ein regulärer Ausdruck für ein Zeichen vor einem Bruch (zum Beispiel am Ende eines Satzes ". ? ! :"). Wenn Sie beispielsweise keinen Segmenttext nach einem Doppelpunkt möchten, löschen Sie einfach : aus jedem <regel><beforebreak> Code.

    • <regel> <afterbreak>

      Ein regulärer Ausdruck für ein Zeichen nach einem Bruch (zum Beispiel am Anfang eines neuen Satzes; ein Leerzeichen und ein Großbuchstabe).

  3. Speichern Sie die modifizierte SRX-Datei.

Laden Sie neue Segmentierungsregeln hoch

Um modifizierte oder neue Segmentierungsregeln hochzuladen, befolgen Sie diese Schritte:

  1. Gehen Sie von der Seite Einstellungen Setup_gear.png zum Abschnitt Projekteinstellungen und scrollen Sie nach unten zu Segmentierung.

    Die Seite Segmentierung öffnet sich.

  2. Klicken Sie auf Neu.

    Die Seite Benutzerdefinierte XLSX- oder SRX-Segmentierungsdatei hochladen öffnet sich.

  3. Wählen Sie eine Sprache<1>} aus der Dropdown-Liste aus.

  4. Geben Sie einen Namen für die Regel an.

  5. Klicken Sie auf Datei auswählen.

    Ein Fenster zur Dateiauswahl öffnet sich.

  6. Wählen Sie die modifizierte Regeldatei zum Hochladen aus.

  7. Überprüfen Sie Primär, wenn die benutzerdefinierten Segmentierungsregeln die primären Segmentierungsregeln für die ausgewählte Sprache sein sollen.

  8. Klicken Sie auf Erstellen.

    Die Seite Segmentierung öffnet sich und die Regel wurde zur Liste hinzugefügt.

Benutzerdefinierte Segmentierungsregeln beim Job-Import verwenden

Um benutzerdefinierte Regeln beim Job-Import zu verwenden oder die Zielsegmentlänge zu konfigurieren, befolgen Sie diese Schritte:

  1. Klicken Sie im Schritt 8 von einen Job erstellen auf Segmentierung und Segmentlänge in den Dateiimport-Einstellungen.

    Die Dropdown-Liste der Optionen Segmentierung und Segmentlänge öffnet sich.

  2. Wählen Sie die modifizierten Regeln aus der Dropdown-Liste Quellsegmentierungsregeln aus.

  3. Optional können Sie eine Begrenzung für die Zielsegmentlänge basierend auf den Projektanforderungen (z. B. Untertitelübersetzung) konfigurieren:

    • Wählen Sie Max. Zielsegmentlänge in % des Quelltextes und geben Sie den gewünschten Prozentsatz ein, um die Segmentlänge basierend auf dem Quellsegment zu begrenzen.

    • Wählen Sie Max. Zielsegmentlänge in Zeichen und geben Sie die Zeichenanzahl ein, um die Segmentlänge nach Anzahl der Zeichen zu begrenzen.

  4. Klicken Sie auf Erstellen.

    Der Job wird erstellt und der Liste unter Verwendung der angegebenen Segmentierungsregeln hinzugefügt.

Beispiel zur Änderung der Segmentierung (1 Zelle 1 Segment)

Entfernen Sie alle inner Segmentierungsregeln aus einer SRX-Datei und lassen Sie nur die grundlegende Segmentierung des gesamten Absatzes, Elements oder der Zelle, die angewendet wird, übrig. Diese Segmentierungsregel kann auf jeden Dateityp angewendet werden (MS Word, XML, HTML, Excel usw.).

Beispiel:

A

B

1

Peter! Warten!

2

Hallo.

3

Dieses XLSX-Beispiel, das mit der Standardsegmentierung importiert wurde, wird 3 Segmente haben: Peter!, Warten! und Hallo.

Wenn alle inneren Segmentierungen entfernt werden und nur die grundlegende Segmentierung basierend auf der Zelle übrig bleibt, gibt es nur zwei Segmente: Peter! Warten! und Hallo.

Bearbeiten Sie die SRX-Datei, um alle Standardsegmentierungsregeln zu entfernen, d. h. den Code zwischen <!-- break rules --> und </languagerule>.

Beispiel:

1cell-1segment-srx.png

Kaskadierung kann dazu führen, dass dieses Beispiel nicht funktioniert. In einem solchen Fall öffnen Sie die bearbeitete SRX-Datei in Notepad++, suchen Sie die beiden Attribute des header Elements und ändern Sie beide in no.

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.