.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das .XML Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen import.

Standardmäßige Einstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Optionen für den import können verwendet werden, um das Verhalten beim import zu ändern.

KI-Dienste können sehr effektiv dabei sein, Formatprobleme in .XML-basierten Dateien zu identifizieren.

Dateitypen

.XML

Import-Optionen

Einfache import-Regeln

Elemente

Nur ausgewählte Elemente (d. h. name, title, para) werden importiert. Ein Sternchen (*) importiert alle Elemente.
Attribute

Nur ausgewählte Attribute (d. h. name, title, para) werden importiert. Ein Sternchen (*) importiert alle Attribute.
Übersetzbare Inline-Elemente

Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als übersetzbare Inline-Elemente importiert.
Nicht übersetzbare Inline-Elemente

Das ausgewählte Inline-Element name, title, para wird in Tags konvertiert und der Content ist nicht übersetzbar.

Wichtig

Probleme mit Tags sind eine häufige Ursache für Fehler beim exportieren (z. B. Datei konnte nicht generiert werden), insbesondere bei Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie vor dem exportieren von Dateien immer sicher, dass Tags und Formatierung korrekt sind, indem Sie Prüfungen zur Qualitätssicherung ausführen.
Inline-Elemente automatisch identifizieren

Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.
Elemente (als HTML verarbeitet)

Der ausgewählte Elementcode wird als .HTML verarbeitet. .HTML Einstellungen für den import wie Leerzeichen beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.

Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Dies gilt nicht für untergeordnete Elemente des ausgewählten Elements, sofern nicht anders angegeben.
Gesperrte Elemente

Die ausgewählten Elemente werden als gesperrt importiert.
Gesperrte Attribute

Die ausgewählten Attribute werden als gesperrt importiert.
In Zeichenentitäten konvertieren

Geben Sie eine Liste von Zeichen-Referenzen (durch Kommas getrennt) in die Output-Datei ein.

Beispiel:

Wenn Anführungszeichen (") erforderlich sind, würden diese als " dargestellt werden, das Zeichen Σ würde als Σ dargestellt werden; verwenden Sie ",Σ . & und < werden immer als & bzw. < exportiert.
In Phrase TMS-Tags konvertieren

Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
ICU-Nachrichten analysieren

ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
XML-Entitäten importieren

XML-Entitäten in DTD-Deklaration werden zur Übersetzung importiert.
Benutzerdefinierte allgemeine Entitäten erweitern
Kommentare importieren

Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Option Elemente (als HTML verarbeitet) angegeben.
Unterelemente von der Segmentierung ausschließen

Auswählen, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML verschachtelte Strukturen enthält, bei denen eine Segmentierung die logische Bedeutung des Textes zerstören würde.
XSLT-Vorschaudatei erstellen

Ein .XSL-Stylesheet kann hochgeladen werden, um daraus eine lesbare Vorschau-Datei zu generieren.

XML-Einstellungen unter Verwendung von XPath

Die Verwendung der XPath-Query-Sprache ermöglicht die Erstellung komplexer Import-Regeln sowie einiger zusätzlicher Funktionen, die in einfachen Import-Regeln nicht verfügbar sind.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den eigentlichen Textknoten.

Vertrautheit mit XPath wird vor dem verwenden empfohlen.

Kontexthinweis, Kontext-Key und Max. Zielsprache-Länge werden für Dateien mit mehr als 10.000 XML-Elementen nicht verarbeitet.

Kontext-Key

Konstituiert gegebenenfalls TM-Kontext (101% Matches).

Wenn kein XPath-Ausdruck für Kontext-Key angegeben ist, generiert der XML-filter standardmäßig keinen Kontext-Key. Um einen Kontext-Key basierend auf dem strukturellen Pfad des Segment zu generieren, setzen Sie Segment-Kontext auf Segment-Key unter den Translation Memory-Übereinstimmungen Import-Einstellungen.
Kontexthinweis

Importieren Sie Elemente oder Kontext-Attribute für jedes Element.
Max. Ziellänge

Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich Kontexthinweis im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.
Leerzeichen beibehalten

Leer lassen, um Leerzeichen in Elementen zu erhalten. Wenden Sie xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen zu erhalten, oder verwenden Sie einen beliebigen XPath-Ausdruck.
Von der Segmentierung ausgeschlossene Knoten

Geben Sie XML-Elemente oder Attribute an, die nicht als Segment behandelt werden sollen. Geben Sie einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder aus diesen Knoten extrahierte Text wird als einzelnes Segment beibehalten, anstatt in kleinere Einheiten aufgeteilt zu werden.

Geben Sie //element[@attr='value'] ein, um alle <element> Knoten, die das Attribut attr=\"value\" enthalten, von der Segmentierung auszuschließen.

HTML-Vorschau mit XSLT-Stylesheet

Die Sprache XSLT (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente für in-context preview-Zwecke in das .HTML-Format zu transformieren. Dementsprechend werden Vorschau-Dateien, die über Preview translation im Dokument-Menü heruntergeladen werden, mit einer HTML-Erweiterung geliefert. Phrase unterstützt derzeit XSLT 2.0.

Das für die Vorschau verwendete XSLT muss auf der Zielsprache und nicht auf der Ausgangssprache basieren.

Klicken Sie auf Choose file, um ein Stylesheet zu importieren.

Klicken Sie auf Download XSLT, um das Stylesheet nach dem Dateiimport herunterzuladen.

CDATA in XML-Datei

CDATA steht für Character Data und ist definiert als Textblöcke, die nicht vom Parser verarbeitet, sondern als Markup erkannt werden. Vordefinierte Entitäten wie <, > und & erfordern eine Eingabe und sind im Markup im Allgemeinen schwer zu lesen. In solchen Fällen kann der CDATA-Abschnitt verwendet werden.

Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter Elements (processed as HTML) aufgelistet werden.

Wenn die Ausgangssprache-Datei CDATA enthält und Segment XML verwendet wird, wird CDATA zu jedem Segment in der fertigen Datei hinzugefügt.

CDATA wird nur dann in ein Segment unterteilt, wenn ein klarer Hinweis auf einen Segmentumbruch vorliegt, wie z. B. Satzzeichen oder Abstände.

Ausgangssprache:

<text><![CDATA[übersetzbar text A. übersetzbar text B.]]></text>

Zielsprache:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>

Die abgeschlossene Datei ist gültiges .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für Wordpress XML:

XML

XPath
Elemente & Attribute

//*[local-name()='encoded']|//description|//title
Elemente (als HTML verarbeitet)

//*[local-name()='encoded']|//description|//title
In Phrase-Tags konvertieren

(\[[^\]]++\])++

Wählen Sie Leerzeichen beibehalten unter den HTML-Einstellungen aus.

Mehrsprachige XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem importieren zugeordnet werden. Sie werden mit in der Jobs-Tabelle dargestellt. Bei Import in mehrere Zielsprachen setzt sich die abgeschlossene Datei aus allen Zielsprachen zusammen.

Phrase unterstützt XML-Dateien, bei denen sowohl Ausgangssprache- als auch Zielsprache-Elemente für alle Absätze vorhanden sind, selbst wenn die Zielsprache leer ist. Wenn sich die Segmentierung der Ausgangssprache und der Zielsprache unterscheidet, ist die Segmentierung der Ausgangssprache maßgebend.

Einzelne Sprachelemente müssen alle Nachfahren desselben trans-unit-Elements sein, und eine Sprache darf nicht in der anderen enthalten sein. Content der Ausgangssprache und der Zielsprache kann nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente den XPath für die Ausgangssprache oder Zielsprache innerhalb des trans-unit-Elements erfüllen, wird nur das erste für die Übersetzung importiert.

Wählen Sie beim Erstellen eines Job im Bereich Dateityp Mehrsprachige XML aus, bevor Sie die Importoptionen anwenden. Falls nicht anders angegeben, wird die Datei als Standard-.XML importiert.
Tag-Content der Ausgangs-.XML-Datei kann im Editor durch Klicken auf Tags erweitern im Menü Tool visualisiert und durch Klicken auf F2 bearbeitet werden.

Beispiel:

Beispiel für teilweise übersetzten Text von Englisch nach Deutsch und Französisch. Alle <tuv lang=\"en\">, <tuv lang=\"de\"> und <tuv lang=\"fr\"> sind untergeordnete Elemente desselben <tu>-Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note=\"anderer Kontexthinweis\" key=\"ID 255\" maxlen=\"18\"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Für den import von mehrsprachigen .XML-Dateien muss die XPath-Query-Sprache verwendet werden. Siehe Beispiel oben als Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Elemente mit Unterelementen in Ausgangs- und Zieltext

//tu
Elemente mit Quelltext

tuv[@lang='en']/seg (in Bezug auf das übergeordnete Element //tu)
Nicht übersetzbare Inline-Elemente

Alle Elemente in der Ausgangssprache oder Zielsprache werden als übersetzbare Inline-Elemente betrachtet, sofern sie hier nicht als nicht übersetzbares Element definiert sind.
Kontext-Key

Geben Sie einen Kontext-Key an, der mit dem Segment im Translation Memory gespeichert und für den Match-Kontext verwendet wird.
Kontexthinweis

Importieren Sie Elemente oder Kontext-Attribute für jedes Element.
Max. Ziellänge

Importiere Elemente oder die maximale Ziellänge für jedes Element
In Zeichenentitäten konvertieren

Geben Sie eine Liste von Zeichen-Referenzen (durch Kommas getrennt) in die Output-Datei ein.

Beispiel:

Wenn Anführungszeichen (") erforderlich sind, würden diese als " dargestellt werden, das Zeichen Σ würde als Σ dargestellt werden; verwenden Sie ",Σ . & und < werden immer als & bzw. < exportiert.
In Phrase TMS-Tags konvertieren

Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
ICU-Nachrichten analysieren

ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
HTML-Teilfilter verwenden

Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mithilfe der HTML-Dateiimport-Einstellungen verwendet werden. Absatz-Tags <p> Erstellen neue Segmente, auch wenn Segment mehrsprachig XML nicht ausgewählt ist.
HTML-Teilfilter verwenden

Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mithilfe der HTML-Dateiimport-Einstellungen verwendet werden.
Mehrsprachige XML-Datei segmentieren

Text wird durch eine allgemeine Segmentierung Regel segmentiert und nicht durch ein Segment pro Zelle.

Vorsicht

Das Anwenden von Segment mehrsprachig XML auf eine Datei, die Zielsprache-Text enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Ausgangssprache als in der Zielsprache führen.
Segmentstatus für nicht leeres Ziel festlegen

Standard-Status für Bestätigung auswählen und ob bestätigte Segmente automatisch zum TM hinzugefügt werden.
XSLT-Vorschaudatei erstellen

Ein .XSL-Stylesheet kann hochgeladen werden, um daraus eine lesbare Vorschau-Datei zu generieren.

Beispiel:

Wenn eine mehrsprachige .XML einen Namespace enthält, könnte der XPath wie folgt lauten:

Elemente mit Unterelementen in Ausgangs- und Zieltext

//*[local-name()='trans-unit']
Elemente mit Quelltext

*[local-name()='source']
Elemente mit Zieltext

*[local-name()='target']

.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Dateitypen

Import-Optionen

Wichtig

HTML-Vorschau mit XSLT-Stylesheet

CDATA in XML-Datei

Anwendungsspezifische Einstellungen

Wordpress XML

Mehrsprachige XML

Import-Optionen

Vorsicht