Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen Import.
Die Standardeinstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.
KI-Dienste können sehr effektiv dabei sein, Formatprobleme in .XML-basierten Dateien zu identifizieren.
Dateitypen
-
.XML
Import-Optionen
Einfaches Importregeln
-
Nur ausgewählte Elemente (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen () importiert alle Elemente.
-
Nur ausgewählte Attribute (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen () importiert alle Attribute.
-
Wenn die Option ausgewählt ist, werden alle Elemente im übersetzbaren Text als Übersetzbare Inline Elemente importiert.
-
Ausgewählte Inline-Elemente Name, Titel, Absatz werden in Tags umgewandelt und der Inhalt wird nicht übersetzbar sein.
Wichtig
Probleme mit Tags sind eine häufige Ursache für Exportfehler (z.B. ), insbesondere bei Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie immer sicher, dass Tags und Formatierungen korrekt sind, bevor Sie Dateien exportieren, indem Sie Qualitätssicherungs Prüfungen durchführen.
-
Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.
-
Der ausgewählte Elementcode wird als .HTML verarbeitet. .HTML Import-Einstellungen wie Whitespace beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.
Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Es gilt nicht für Kinder des ausgewählten Elements, es sei denn, es ist anders angegeben.
-
Die ausgewählten Elemente werden als Gesperrt importiert.
-
Die ausgewählten Attribute werden als Gesperrt importiert.
-
Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.
Beispiel:
-
Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
-
ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
-
XML-Entitäten in DTD-Deklaration werden zur Übersetzung importiert.
-
-
Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Optionen (als HTML verarbeitet) angegeben.
-
Wählen Sie aus, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML verschachtelte Strukturen enthält, bei denen die Segmentierung die logische Bedeutung des Textes beeinträchtigen würde.
-
Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.
XML-Einstellungen mit XPath
Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in einfachen Importregeln nicht verfügbar sind.
Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.
Vertrautheit mit XPath wird empfohlen, bevor Sie es verwenden.
, und werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.
-
Konstituiert gegebenenfalls TM-Kontext (101% Übereinstimmungen).
-
Importiere Elemente oder Kontextattribute für jedes Element.
-
Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.
-
Leer lassen, um Leerzeichen in den Elementen beizubehalten. Wende xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.
-
Gib XML-Elemente oder Attribute an, die nicht segmentiert werden sollen. Gib einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder Text, der aus diesen Knoten extrahiert wird, bleibt als ein einzelnes Segment erhalten, anstatt in kleinere Einheiten aufgeteilt zu werden.
Gib //element[@attr='value'] ein, um alle
<element>Knoten, die das Attributattr="value"enthalten, von der Segmentierung auszuschließen.
HTML-Vorschau mit XSLT-Stylesheet
Die XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente in .HTML-Format für In-Kontext-Vorschau Zwecke zu transformieren. Dementsprechend kommen Vorschau-Dateien, die über Vorschau-Übersetzung im Dokument Menü heruntergeladen werden, mit HTML-Erweiterung. Phrase unterstützt derzeit XSLT 2.0.
Die für die Vorschau verwendete XSLT muss auf dem Ziel und nicht auf der Quelle basieren.
Klicke Datei auswählen, um ein Stylesheet zu importieren.
Klicke XSLT herunterladen, um das Stylesheet nach dem Dateiimport herunterzuladen.
CDATA in XML-Datei
CDATA bedeutet Zeichen-Daten und wird als Textblöcke definiert, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie <, > und & erfordern das Tippen und sind im Markup allgemein schwer zu lesen. In solchen Fällen kann der CDATA-Bereich verwendet werden.
Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter aufgeführt werden.
Wenn die Quelldatei CDATA enthält und das verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.
CDATA wird nur segmentiert, wenn es einen klaren Hinweis auf einen Segmentwechsel gibt, wie z.B. Interpunktion oder Leerzeichen.
Quelle:
<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>
Ziel:
<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>
Die abgeschlossene Datei ist gültig .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.
Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem Import zugeordnet werden. Sie werden mit in der Jobs-Tabelle dargestellt. Wenn in mehrere Zielsprache importiert, besteht die Abgeschlossen Datei aus allen Zielsprache.
Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Ziel-Elemente für alle Absätze enthalten, auch wenn das Ziel leer ist. Wenn die Quell- und Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung maßgeblich.
Einzelne Sprachelemente müssen alle Nachkommen des gleichen trans-unit-Elements sein, und eine Sprache kann nicht in der anderen enthalten sein. Quell- und Zielinhalt können nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente dem XPath für Quelle oder Ziel innerhalb des trans-unit-Elements entsprechen, wird nur das erste für die Übersetzung importiert.
-
Beim Erstellen eines Jobs wählen Sie im -Bereich aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard .XML importiert.
-
Tag-Inhalt der Quell-.XML-Datei kann im Editor visualisiert werden, indem Sie auf Tags erweitern im -Menü klicken und bearbeitet werden, indem Sie auf F2 klicken.
Beispiel:
Beispiel für teilweise übersetzten Text aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder des gleichen <tu>-Elements.
<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16">
<tuv lang="en">
<seg>Erstes Segment.</seg>
</tuv>
<tuv lang="de">
<seg>Erstes Segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="ein weiterer Kontexthinweis" key="ID 255" maxlen="18">
<tuv lang="en">
<seg>Zweites Segment.</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
Import-Optionen
Für den Import von mehrsprachigen .XML-Dateien muss die XPath Abfragesprache verwendet werden. Siehe Beispiel oben zur Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.
-
//tu -
tuv[@lang='en']/seg(in Bezug auf das übergeordnete Element//tu) -
Alle Elemente in der Quelle oder dem Ziel gelten als übersetzbare Inline-Elemente, es sei denn, sie werden hier als nicht übersetzbare Inline-Elemente angegeben.
-
Geben Sie einen Kontextschlüssel an, der mit dem Segment im Translation Memory gespeichert wird und für den Kontext des Treffers verwendet wird.
-
Importiere Elemente oder Kontextattribute für jedes Element.
-
Importiere Elemente oder die maximale Ziellänge für jedes Element
-
Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.
Beispiel:
-
Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
-
ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
-
Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden. Absatz-Tags
<p>erstellen neue Segmente, auch wenn nicht ausgewählt ist. -
Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden.
-
Text wird durch eine allgemeine Segmentierungsregel segmentiert, anstatt ein Segment pro Zelle zu erstellen.
Vorsicht
Das Anwenden von auf eine Datei, die Zieltext enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Ausgangs- und Zielsprache führen.
-
Wählen Sie den Standardbestätigungsstatus aus und ob bestätigte Segmente automatisch zur TM hinzugefügt werden.
-
Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.
Beispiel: