.XML - Erweiterbare Auszeichnungssprache (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen Import.

Die Standardeinstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.

KI-Dienste können sehr effektiv dabei helfen, Formatprobleme in .XML-basierten Dateien zu identifizieren.

Dateitypen

.XML

Import-Optionen

Einfaches Importregeln

Elemente

Nur ausgewählte Elemente (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Elemente.
Attribute

Nur ausgewählte Attribute (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Attribute.
Übersetzbare Inline-Elemente

Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als Übersetzbare Inline Elemente importiert.
Nicht übersetzbare Inline-Elemente

Ausgewählte Inline-Elemente Name, Titel, Absatz werden in Tags umgewandelt und der Inhalt wird nicht übersetzbar sein.

Wichtig

Probleme mit Tags sind eine häufige Ursache für Exportfehler (z.B. Datei konnte nicht erstellt werden), insbesondere bei Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie immer sicher, dass Tags und Formatierungen korrekt sind, bevor Sie Dateien exportieren, indem Sie Qualitätssicherungs Prüfungen durchführen.
Inline-Elemente automatisch identifizieren

Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.
Elemente (als HTML verarbeitet)

Der ausgewählte Elementcode wird als .HTML verarbeitet. .HTML Import-Einstellungen wie Whitespace beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.

Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Es gilt nicht für Kinder des ausgewählten Elements, es sei denn, es ist anders angegeben.
Gesperrte Elemente

Die ausgewählten Elemente werden als Gesperrt importiert.
Gesperrte Attribute

Die ausgewählten Attribute werden als Gesperrt importiert.
In Zeichenentitäten konvertieren

Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

Beispiel:

Wenn Anführungszeichen (") erforderlich sind, würden sie als " dargestellt, das Zeichen Σ würde als Σ dargestellt, verwenden Sie ",Σ. & und < werden immer als & und < exportiert.
In Phrase TMS-Tags konvertieren

Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
ICU-Nachrichten analysieren

ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
XML-Entitäten importieren

XML-Entitäten in DTD-Deklaration werden zur Übersetzung importiert.
Individuelle allgemeine Entitäten erweitern
Kommentare importieren

Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Optionen (als HTML verarbeitet) angegeben.
Unterelemente von der Segmentierung ausschließen

Wählen Sie aus, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML geschachtelte Strukturen enthält, bei denen die Segmentierung die logische Bedeutung des Textes beeinträchtigen würde.
XSLT-Vorschau-Datei erstellen

Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.

XML-Einstellungen mit XPath

Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in einfachen Importregeln nicht verfügbar sind.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Vertrautheit mit XPath wird empfohlen, bevor Sie es verwenden.

Kontexthinweis, Kontext-Key und Max. Zielsprachelänge werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.

Kontext-Key

Konstituiert gegebenenfalls TM-Kontext (101% Übereinstimmungen).
Kontexthinweis

Importiere Elemente oder Kontextattribute für jedes Element.
Max. Ziellänge

Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich Kontexthinweis im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.
Leerzeichen beibehalten

Leer lassen, um Leerzeichen in den Elementen beizubehalten. Wende xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.
Von der Segmentierung ausgeschlossene Knoten

Gib XML-Elemente oder Attribute an, die nicht segmentiert werden sollen. Gib einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder Text, der aus diesen Knoten extrahiert wird, bleibt als ein einzelnes Segment erhalten, anstatt in kleinere Einheiten aufgeteilt zu werden.

Gib //element[@attr='value'] ein, um alle <element> Knoten, die das Attribut attr="value" enthalten, von der Segmentierung auszuschließen.

HTML-Vorschau mit XSLT-Stylesheet

Die XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente in .HTML-Format für Vorschau im Kontext zu transformieren. Dementsprechend kommen die über Vorschau der Übersetzung im Dokument Menü heruntergeladenen Vorschau-Dateien mit HTML-Erweiterung. Phrase unterstützt derzeit XSLT 2.0.

Die für die Vorschau verwendete XSLT muss auf dem Ziel und nicht auf der Quelle basieren.

Klicke Datei auswählen, um ein Stylesheet zu importieren.

Klicke XSLT herunterladen, um das Stylesheet nach dem Dateiimport herunterzuladen.

CDATA in XML-Datei

CDATA bedeutet Zeichen-Daten und wird als Textblöcke definiert, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie <, > und & erfordern das Tippen und sind im Markup allgemein schwer zu lesen. In solchen Fällen kann der CDATA-Bereich verwendet werden.

Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgeführt werden.

Wenn die Quelldatei CDATA enthält und das Segment XML verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.

CDATA wird nur segmentiert, wenn es einen klaren Hinweis auf einen Segmentwechsel gibt, wie z.B. Interpunktion oder Leerzeichen.

Quelle:

<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>

Ziel:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>

Die abgeschlossene Datei ist gültig .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für Wordpress XML:

XML

XPath
Elemente & Attribute

//*[local-name()='encoded']|//description|//title
Elemente (als HTML verarbeitet)

//*[local-name()='encoded']|//description|//title
In Phrase-Tags konvertieren

(\[[^\]]++\])++

Wählen Sie Weißräume beibehalten unter HTML Einstellungen.

Mehrsprachiges XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem Import zugeordnet werden. Sie werden mit in der Jobs-Tabelle dargestellt. Wenn sie in mehrere Zielsprache importiert werden, besteht die Abgeschlossen Datei aus allen Zielsprache.

Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Ziel-Elemente für alle Absätze enthalten, selbst wenn das Ziel leer ist. Wenn die Quell- und Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung maßgeblich.

Einzelne Sprachelemente müssen alle Nachkommen des gleichen trans-unit-Elements sein, und eine Sprache darf nicht in der anderen enthalten sein. Quell- und Zielinhalt können nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente dem XPath für Quelle oder Ziel innerhalb des trans-unit-Elements entsprechen, wird nur das erste für die Übersetzung importiert.

Beim Erstellen eines Jobs wählen Sie Mehrsprachige XML im Dateityp-Bereich aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard .XML importiert.
Der Tag-Inhalt der Quell-.XML-Datei kann im Editor visualisiert werden, indem Sie auf Tags erweitern im Werkzeug-Menü klicken und bearbeitet werden, indem Sie auf F2 klicken.

Beispiel:

Beispiel für teilweise übersetzten Text aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder des gleichen <tu>-Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="ein weiterer Kontexthinweis" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Für den Import von mehrsprachigen .XML-Dateien muss die XPath Abfragesprache verwendet werden. Siehe Beispiel oben zur Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Elemente mit Quell- und Zielunterelementen

//tu
Elemente mit Quelltext

tuv[@lang='en']/seg (in Bezug auf das übergeordnete Element //tu)
Nicht übersetzbare Inline-Elemente

Alle Elemente in der Quelle oder dem Ziel gelten als übersetzbare Inline-Elemente, es sei denn, sie werden hier als nicht übersetzbare Inline-Elemente angegeben.
Kontext-Key

Geben Sie einen Kontextschlüssel an, der mit dem Segment im Translation Memory gespeichert wird und für den Kontext des Treffers verwendet wird.
Kontexthinweis

Importiere Elemente oder Kontextattribute für jedes Element.
Max. Ziellänge

Importiere Elemente oder die maximale Ziellänge für jedes Element
In Zeichenentitäten konvertieren

Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

Beispiel:

Wenn Anführungszeichen (") erforderlich sind, würden sie als " dargestellt, das Zeichen Σ würde als Σ dargestellt, verwenden Sie ",Σ. & und < werden immer als & und < exportiert.
In Phrase TMS-Tags konvertieren

Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.
ICU-Nachrichten analysieren

ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.
HTML-Teilfilter verwenden

Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden. Absatz-Tags <p> erstellen neue Segmente, auch wenn Segment Mehrsprachige XML nicht ausgewählt ist.
HTML-Teilfilter verwenden

Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden.
Segment mehrsprachige XML

Text wird durch eine allgemeine Segmentierungsregel segmentiert, anstatt ein Segment pro Zelle zu erstellen.

Vorsicht

Das Anwenden von Segment mehrsprachiges XML auf eine Datei, die Zieltext enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Ausgangs- und Zielsprache führen.
Segmentstatus für nicht leeres Ziel festlegen

Wählen Sie den Standardbestätigungsstatus aus und ob bestätigte Segmente automatisch zur TM hinzugefügt werden.
XSLT-Vorschau-Datei erstellen

Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.

Beispiel:

Wenn ein mehrsprachiges .XML einen Namensraum enthält, könnte der XPath folgendermaßen aussehen:

Elemente mit Quell- und Zielunterelementen

//*[local-name()='trans-unit']
Elemente mit Quelltext

*[local-name()='source']
Elemente, die Zieltext enthalten

*[local-name()='target']

.XML - Erweiterbare Auszeichnungssprache (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Dateitypen

Import-Optionen

Wichtig

HTML-Vorschau mit XSLT-Stylesheet

CDATA in XML-Datei

Anwendungsspezifische Einstellungen

Wordpress XML

Mehrsprachiges XML

Import-Optionen

Vorsicht