Die Segmentierung ist das Aufteilen von Quelltexten in kleinere Teile. Dies verbessert das Abrufen von zuvor übersetztem Text aus einem Translation Memory. Segmente werden im Editor präsentiert und können gefiltert werden.
Standard-Segmentierungsregeln entsprechen den Besonderheiten jeder unterstützten Sprache und können angepasst werden.
Jobs, die mit schlechter Segmentierung importiert werden, wie schlecht formatierte Dokumentdateien oder die Anwendung unangemessener Segmentierungsanpassungen, können die TM-Match-Werte beeinflussen.
Beispiel:
Gute Segmentierung:
-
Translation Memorys mit mehrsprachigen Zielsprache werden unterstützt und können bidirektional verwendet werden.
Match-Wert von 100%.
Schlechte Segmentierung
-
Translation Memorys mit mehrsprachigen Zielsprache werden unterstützt.
Match-Wert von 100%.
-
und können bidirektional verwendet werden.
Match-Wert von 63%.
Auf Jobs und Projekte können benutzerdefinierte Segmentierungsregeln angewendet werden. Wenn ein Projekt eine angepasste Segmentierung benötigt, muss für dieses Projekt eine Vorlage erstellt werden. Wenn sie als primäre festgelegt sind, werden angepasste Segmentierung Regeln auf alle neuen Jobs angewendet, die für diese Ausgangssprache importiert werden.
Es gibt zwei Arten von Segmentierung Regeln:
-
Abkürzungen der Datei .XLSX
-
Regulärer Ausdruck von .SRX-Dateien
Um angepasste Regeln zu verwenden, herunterladen die Standardregeln herunter, ändere sie, hochladen die geänderte Datei hoch und wende sie dann auf bestimmte Jobs an.
Vorsicht
Beim Hinzufügen benutzerdefinierter Segmentierung Regeln für eine leerzeichenlose CJK Ausgangssprache (während eine Zielsprache Leerzeichen als Worttrenner verwendet) stellen Sie sicher, dass führende oder nachfolgende Leerzeichen zu den Zielsprachen hinzugefügt werden, die durch die benutzerdefinierte Regel aufgeteilt werden; dies trennt Wörter in der Übersetzung. Dies wird normalerweise automatisch auf Segmente angewendet, die durch die Standard-Segmentierungsregeln gebildet werden, da in manuell aufgeteilten Segmenten oder solchen, die durch zusätzliche benutzerdefinierte Segmentierungsregeln gebildet werden, keine Leerzeichen hinzugefügt werden.
Um die Standard-Segmentierung herunterzuladen, folge diesen Schritten:
-
Scrolle auf der Seite
Einstellungen nach unten zum Abschnitt und klicke auf Segmentierung.
Die Seite
öffnet sich. -
Wähle die Sprache aus, die angepasst werden soll, und klicke auf XLSX/SRX exportieren.
Das Fenster
öffnet sich. -
Format auswählen:
-
XLSX bietet eine Liste von Abkürzungen.
-
SRX liefert Regeln regulärer Ausdrücke.
-
-
auswählen eine Sprache aus der Dropdown-Liste.
-
Klicke auf herunterladen.
Die Datei wird auf Ihr System heruntergeladen.
Um eine zuvor hochgeladene Segmentierung herunterzuladen, folge diesen Schritten:
-
Scrolle auf der Seite
Einstellungen nach unten zum Abschnitt und klicke auf Segmentierung.
Die Seite
öffnet sich. -
Klicke rechts auf das Einstellungen Symbol und wähle Spalten anpassen:
-
Die Spalte Dateiname aktivieren
-
Klicke auf einen Dateinamen, um eine vorgespeicherte Regel herunterzuladen.
Für einzelne Sprachen können Abkürzungen angegeben werden, nach denen keine neuen Segmente erstellt werden sollen.
Um Abkürzungen zu bearbeiten, folge diesen Schritten:
-
Öffne die heruntergeladene .XLSX-Datei in einem Editor.
-
ändern den Inhalt mit der folgenden Formatierung:
Die XLSX-Datei muss zwei Spalten ohne Überschriften haben.
-
Spalte 1: Abkürzung anzugeben
-
Spalte 2: Spezifikation des Segmentierung Verhaltens
-
ABBR_UPPER_NUM
Ein neues Segment wird nicht erstellt, wenn auf die Abkürzung ein Leerzeichen folgt und dann eine Zahl, ein Symbol (Mathematik, Währungszeichen, Dingbats usw.) oder ein Wort mit dem ersten Buchstaben in Großbuchstaben.
-
ABBR_NUM
Ein neues Segment wird nicht erstellt, wenn auf die Abkürzung ein Leerzeichen und dann eine Zahl folgt.
-
-
-
Die bearbeitete .XLSX-Datei speichern.
Die Bearbeitung von .SRX-Dateien ist ein komplexer Prozess, der nur für User geeignet ist, die Erfahrung im Umgang mit regulären Ausdrücken haben
Es gibt mehrere Regeln, die in einer SRX-Datei geändert werden können:
-
Text aus einer XLSX-Datei ohne Segmentierung importieren; eine Zelle entspricht einem Segment.
-
Text mit einer neuen Zeile in Reihenfolge importieren, um ein Segment in zwei aufzuteilen.
-
Als Segment Trennzeichen einen Doppelpunkt (oder ein anderes Zeichen) verwenden.
-
Es ist verboten, ein Semikolon (oder ein anderes Zeichen) als Trennzeichen für Segmente zu verwenden.
-
Entfernen einer Abkürzung aus der Liste (der Text wird segmentiert).
Diese Regeln sind Zeichen-basiert; als Segment Trennzeichen kann nur ein einziges Zeichen verwendet werden. Zeichengruppen (zum Beispiel: <p>) können nicht als Segmente verwendet werden.
Um eine SRX-Datei zu bearbeiten, folge diesen Schritten:
-
Öffne die Datei in einem Text Editor wie Notepad ++.
-
Mit regulären Ausdrücken bearbeiten oder die innere Segmentierung vollständig entfernen.
Beispiel:
-
<rule break="no">
Die Liste der Regeln, bei denen das Segment nicht unterbrochen wird. D.h. eine Liste von Abkürzungen
-
<rule> <beforebreak>
Ein regulärer Ausdruck für ein Zeichen vor einer Unterbrechung (zum Beispiel am Ende eines Satzes „. ? ! :“). Wenn du zum Beispiel keinen Segment Text nach einem Doppelpunkt möchtest, lösche einfach
:
aus jedem<rule><beforebreak>
Code. -
<rule> <afterbreak>
Ein regulärer Ausdruck für ein Zeichen nach einer Unterbrechung (zum Beispiel am Anfang eines neuen Satzes; ein Leerzeichen und Großbuchstabe).
-
-
Die geänderte SRX-Datei speichern.
Um geänderte oder neue Segmentierung Regeln hochzuladen, folge diesen Schritten:
-
Scrolle auf der Seite
Einstellungen nach unten zum Abschnitt und klicke auf Segmentierung.
Die Seite
öffnet sich. -
Klicke auf Neu.
Die Seite
öffnet sich. -
Wähle eine
aus der Dropdown Liste. -
Gib einen
für die Regel an. -
Klicke auf Datei auswählen.
Es öffnet sich ein Dateiauswahlfenster.
-
Die geänderte Regeldatei zum hochladen auswählen.
-
Überprüfe
, ob die benutzerdefinierte Segmentierung die primären Segmentierung für die ausgewählte Sprache sind. -
Klicke auf Erstellen.
Die Seite
öffnet sich, und die Regel wurde zur Liste hinzugefügt.
Um benutzerdefinierte Regeln für einen importierten Job zu verwenden, folge diesen Schritten:
-
Im Schritt 8 des Erstellens eines Jobs klicke in den auf Segmentierung und Segmentlänge.
Das Dropdown-Menü Optionen
öffnet sich. -
Wähle die geänderten Regeln aus der Dropdown-Liste
in Ausgangssprache aus. -
Klicke auf Erstellen.
Der Job wird anhand der angegebenen Segmentierung erstellt und der Liste hinzugefügt.
Alle inneren Segmentierung Regeln aus einer SRX-Datei entfernen, so dass nur die grundlegende Segmentierung des gesamten Absatzes, Elements oder Zelle angewendet wird. Diese Segmentierung kann auf jeden Dateityp angewendet werden (MS Word, XML, HTML, Excel usw.).
Beispiel:
Dieses XLSX-Beispiel, das mit der Standard-Segmentierung importiert wird, besteht aus 3 Segmenten: Peter!, Warte!, und Hallo.
Wenn alle inneren Segmentierungen entfernt werden und nur die grundlegende Segmentierung auf der Grundlage der Zelle verbleibt, gibt es nur zwei Segmente: Peter! Warte! und Hallo.
Bearbeite die SRX-Datei, um alle Standard-Segmentierungsregeln zu entfernen, d.h. den Code zwischen <!-- break rules -->
und </languagerule>.
Beispiel:
Kaskadenbildung kann dazu führen, dass dieses Beispiel keinen Job hat. Öffne in einem solchen Fall die bearbeitete SRX-Datei in Notepad++, finde die beiden Attribute des Header-
Elements und ändere beide zu nein
.