Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen Import.
Standard-Einstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.
KI-Dienste können sehr effektiv dabei sein, Formatprobleme in .XML-basierten Dateien zu identifizieren.
Dateitypen
-
.XML
Import-Optionen
Einfaches Importregeln
-
Nur ausgewählte Elemente (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen () importiert alle Elemente.
-
Nur ausgewählte Attribute (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen () importiert alle Attribute.
-
Wenn die Option ausgewählt ist, werden alle Elemente im übersetzbaren Text als Übersetzbare Inline Elemente importiert.
-
Das ausgewählte Inline-Element Name, Titel, Absatz wird in Tags umgewandelt und der Inhalt wird nicht übersetzbar sein.
Wichtig
Probleme mit Tags sind eine häufige Ursache für Exportfehler (z.B. ), insbesondere für Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie immer sicher, dass Tags und Formatierungen korrekt sind, bevor Sie Dateien exportieren, indem Sie Qualitätssicherungs Prüfungen durchführen.
-
Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags umgewandelt.
-
Der Code des ausgewählten Elements wird als .HTML verarbeitet. .HTML Import-Einstellungen wie Whitespace beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.
Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Es gilt nicht für Kinder des ausgewählten Elements, es sei denn, es wird anders angegeben.
-
Die ausgewählten Elemente werden als Gesperrt importiert.
-
Die ausgewählten Attribute werden als Gesperrt importiert.
-
Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.
Beispiel:
-
Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
-
ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
-
XML-Entitäten in DTD-Deklaration werden zum Übersetzen importiert.
-
-
Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Option Elemente (als HTML verarbeitet) angegeben.
-
Wählen Sie aus, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML verschachtelte Strukturen enthält, bei denen die Segmentierung die logische Bedeutung des Textes beeinträchtigen würde.
-
.XSL-Stylesheet kann hochgeladen werden und eine lesbare Vorschau-Datei daraus generiert werden.
XML-Einstellungen mit XPath
Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in einfachen Importregeln nicht verfügbar sind.
XPath-Ausdrücke sollten die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.
Vertrautheit mit XPath wird empfohlen, bevor Sie es verwenden.
, und werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.
-
Konstituiert gegebenenfalls TM-Kontext (101% Matches).
-
Importieren Sie Elemente oder Kontextattribute für jedes Element.
-
Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.
-
Leer lassen, um Leerzeichen in Elementen zu erhalten. Wenden Sie xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen zu erhalten, oder verwenden Sie einen beliebigen XPath-Ausdruck.
-
Geben Sie XML-Elemente oder Attribute an, die nicht segmentiert werden sollen. Geben Sie einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder Text, der aus diesen Knoten extrahiert wird, wird als einzelnes Segment beibehalten, anstatt in kleinere Einheiten aufgeteilt zu werden.
Geben Sie //element[@attr='value'] ein, um alle
<element>Knoten auszuschließen, die das Attributattr="value"aus der Segmentierung enthalten.
HTML-Vorschau mit XSLT-Stylesheet
Die XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente in .HTML-Format für In-Kontext-Vorschau Zwecke zu transformieren. Dementsprechend kommen Vorschau-Dateien, die über Vorschau-Übersetzung im Dokument Menü heruntergeladen werden, mit HTML-Erweiterung. Die Phrase unterstützt derzeit XSLT 2.0.
Die für die Vorschau verwendete XSLT muss auf der Zielsprache und nicht auf der Ausgangssprache basieren.
Klicken Sie auf Datei auswählen, um ein Stylesheet zu importieren.
Klicken Sie auf XSLT herunterladen, um das Stylesheet nach dem Datei-Import herunterzuladen.
CDATA in XML-Datei
CDATA bedeutet Zeichen-Daten und wird als Textblöcke definiert, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie <, > und & erfordern das Tippen und sind im Markup im Allgemeinen schwer zu lesen. In solchen Fällen kann der CDATA-Bereich verwendet werden.
Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter aufgelistet werden.
Wenn die Quelldatei CDATA enthält und das verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.
CDATA wird nur segmentiert, wenn es einen klaren Hinweis auf einen Segmentwechsel wie Interpunktion oder Leerzeichen gibt.
Quelle:
<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>
Ziel:
<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>
Die abgeschlossene Datei ist gültig .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.
Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem Import zugeordnet werden. Sie werden mit in der Jobs Tabelle dargestellt. Wenn in mehrere Zielsprache importiert, besteht die Abgeschlossen Datei aus allen Zielsprache.
Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Ziel-Elemente für alle Absätze enthalten, auch wenn das Ziel leer ist. Wenn die Quell- und Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung entscheidend.
Einzelne Sprachelemente müssen alle Nachkommen des gleichen trans-unit-Elements sein, und eine Sprache kann nicht innerhalb der anderen enthalten sein. Quell- und Zielinhalt können nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente dem XPath für Quelle oder Ziel innerhalb des trans-unit-Elements entsprechen, wird nur das erste für die Übersetzung importiert.
-
Beim Erstellen eines Jobs wählen Sie im Bereich aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard .XML importiert.
-
Tag-Inhalt der Quell-.XML-Datei kann im Editor visualisiert werden, indem Sie auf Tags erweitern im Menü klicken und bearbeitet werden, indem Sie auf F2 klicken.
Beispiel:
Beispiel für teilweise übersetzten Text von Englisch nach Deutsch und Französisch. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder des gleichen <tu> Elements.
<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16">
<tuv lang="en">
<seg>Erster Segment.</seg>
</tuv>
<tuv lang="de">
<seg>Erstes Segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="ein anderer Kontexthinweis" key="ID 255" maxlen="18">
<tuv lang="en">
<seg>Zweites Segment.</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
Import-Optionen
Für den Import von mehrsprachigen .XML-Dateien muss die XPath Abfragesprache verwendet werden. Siehe Beispiel oben zur Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll und nicht den tatsächlichen Textknoten.
-
//tu -
tuv[@lang='de']/seg(in Bezug auf das übergeordnete Element//tu) -
Alle Elemente in Quelle oder Ziel werden als übersetzbare Inline-Elemente betrachtet, es sei denn, sie werden hier als nicht übersetzbare Inline-Elemente angegeben.
-
Geben Sie einen Kontextschlüssel an, der mit dem Segment in das Translation Memory gespeichert wird und für den Kontextabgleich verwendet wird.
-
Importieren Sie Elemente oder Kontextattribute für jedes Element.
-
Importiere Elemente oder die maximale Ziellänge für jedes Element
-
Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.
Beispiel:
-
Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
-
ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
-
Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den HTML-Dateiimport-Einstellungen verwendet werden. Absatz-Tags
<p>erstellen neue Segmente, auch wenn nicht ausgewählt ist. -
Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den HTML-Dateiimport-Einstellungen verwendet werden.
-
Text wird durch eine allgemeine Segmentierungsregel segmentiert, anstatt ein Segment pro Zelle.
Vorsicht
Die Anwendung von auf eine Datei, die Zieltext enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Quelle im Vergleich zum Ziel führen.
-
Wählen Sie den Standardbestätigungsstatus und ob bestätigte Segmente automatisch zum TM hinzugefügt werden.
-
.XSL-Stylesheet kann hochgeladen werden und eine lesbare Vorschau-Datei daraus generiert werden.
Beispiel: