Dateiimport-Einstellungen

.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen Import.

Standard-Einstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.

KI-Dienste können sehr effektiv dabei sein, Formatprobleme in .XML-basierten Dateien zu identifizieren.

Dateitypen

  • .XML

Import-Optionen

Einfaches Importregeln

  • Elemente

    Nur ausgewählte Elemente (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Elemente.

  • Attribute

    Nur ausgewählte Attribute (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Attribute.

  • Übersetzbare Inline-Elemente

    Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als Übersetzbare Inline Elemente importiert.

  • Nicht übersetzbare Inline-Elemente

    Das ausgewählte Inline-Element Name, Titel, Absatz wird in Tags umgewandelt und der Inhalt wird nicht übersetzbar sein.

    Wichtig

    Probleme mit Tags sind eine häufige Ursache für Exportfehler (z.B. Datei konnte nicht generiert werden), insbesondere für Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie immer sicher, dass Tags und Formatierungen korrekt sind, bevor Sie Dateien exportieren, indem Sie Qualitätssicherungs Prüfungen durchführen.

  • Inline-Elemente automatisch identifizieren

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags umgewandelt.

  • Elemente (als HTML verarbeitet)

    Der Code des ausgewählten Elements wird als .HTML verarbeitet. .HTML Import-Einstellungen wie Whitespace beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.

    Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Es gilt nicht für Kinder des ausgewählten Elements, es sei denn, es wird anders angegeben.

  • Gesperrte Elemente

    Die ausgewählten Elemente werden als Gesperrt importiert.

  • Gesperrte Attribute

    Die ausgewählten Attribute werden als Gesperrt importiert.

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, würden sie als &quot; dargestellt, das Zeichen Σ würde als &#x3A3; dargestellt, verwenden Sie &quot;,&#x3A3;. & und < werden immer als &amp; und &lt; exportiert.

  • In Phrase TMS-Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.

  • XML-Entitäten importieren

    XML-Entitäten in DTD-Deklaration werden zum Übersetzen importiert.

  • Benutzerdefinierte allgemeine Entitäten erweitern

  • Kommentare importieren

    Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Option Elemente (als HTML verarbeitet) angegeben.

  • Unterelemente von der Segmentierung ausschließen

    Wählen Sie aus, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML verschachtelte Strukturen enthält, bei denen die Segmentierung die logische Bedeutung des Textes beeinträchtigen würde.

  • XSLT-Vorschaudatei erstellen

    .XSL-Stylesheet kann hochgeladen werden und eine lesbare Vorschau-Datei daraus generiert werden.

XML-Einstellungen mit XPath

Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in einfachen Importregeln nicht verfügbar sind.

XPath-Ausdrücke sollten die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Vertrautheit mit XPath wird empfohlen, bevor Sie es verwenden.

Kontexthinweis, Kontext-Key und Max. Zielsprache Länge werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.

  • Kontext-Key

    Konstituiert gegebenenfalls TM-Kontext (101% Matches).

  • Kontexthinweis

    Importieren Sie Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich Kontexthinweis im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Leer lassen, um Leerzeichen in Elementen zu erhalten. Wenden Sie xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen zu erhalten, oder verwenden Sie einen beliebigen XPath-Ausdruck.

  • Von der Segmentierung ausgeschlossene Knoten

    Geben Sie XML-Elemente oder Attribute an, die nicht segmentiert werden sollen. Geben Sie einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder Text, der aus diesen Knoten extrahiert wird, wird als einzelnes Segment beibehalten, anstatt in kleinere Einheiten aufgeteilt zu werden.

    Geben Sie //element[@attr='value'] ein, um alle <element> Knoten auszuschließen, die das Attribut attr="value" aus der Segmentierung enthalten.

HTML-Vorschau mit XSLT-Stylesheet

Die XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente in .HTML-Format für In-Kontext-Vorschau Zwecke zu transformieren. Dementsprechend kommen Vorschau-Dateien, die über Vorschau-Übersetzung im Dokument Menü heruntergeladen werden, mit HTML-Erweiterung. Die Phrase unterstützt derzeit XSLT 2.0.

Die für die Vorschau verwendete XSLT muss auf der Zielsprache und nicht auf der Ausgangssprache basieren.

Klicken Sie auf Datei auswählen, um ein Stylesheet zu importieren.

Klicken Sie auf XSLT herunterladen, um das Stylesheet nach dem Datei-Import herunterzuladen.

CDATA in XML-Datei

CDATA bedeutet Zeichen-Daten und wird als Textblöcke definiert, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie &lt;, &gt; und &amp; erfordern das Tippen und sind im Markup im Allgemeinen schwer zu lesen. In solchen Fällen kann der CDATA-Bereich verwendet werden.

Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgelistet werden.

Wenn die Quelldatei CDATA enthält und das Segment XML verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.

CDATA wird nur segmentiert, wenn es einen klaren Hinweis auf einen Segmentwechsel wie Interpunktion oder Leerzeichen gibt.

Quelle:

<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>

Ziel:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>

Die abgeschlossene Datei ist gültig .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für Wordpress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase-Tags konvertieren

    (\[[^\]]++\])++

Wählen Sie Weißräume beibehalten unter HTML Einstellungen aus.

Mehrsprachige XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem Import zugeordnet werden. Sie werden mit multilingual_xml.png in der Jobs Tabelle dargestellt. Wenn in mehrere Zielsprache importiert, besteht die Abgeschlossen Datei aus allen Zielsprache.

Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Ziel-Elemente für alle Absätze enthalten, auch wenn das Ziel leer ist. Wenn die Quell- und Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung entscheidend.

Einzelne Sprachelemente müssen alle Nachkommen des gleichen trans-unit-Elements sein, und eine Sprache kann nicht innerhalb der anderen enthalten sein. Quell- und Zielinhalt können nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente dem XPath für Quelle oder Ziel innerhalb des trans-unit-Elements entsprechen, wird nur das erste für die Übersetzung importiert.

  • Beim Erstellen eines Jobs wählen Sie Mehrsprachige XML im Dateityp Bereich aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard .XML importiert.

  • Tag-Inhalt der Quell-.XML-Datei kann im Editor visualisiert werden, indem Sie auf Tags erweitern im Werkzeug Menü klicken und bearbeitet werden, indem Sie auf F2 klicken.

Beispiel:

Beispiel für teilweise übersetzten Text von Englisch nach Deutsch und Französisch. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder des gleichen <tu> Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Erster Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="ein anderer Kontexthinweis" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Für den Import von mehrsprachigen .XML-Dateien muss die XPath Abfragesprache verwendet werden. Siehe Beispiel oben zur Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll und nicht den tatsächlichen Textknoten.

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //tu

  • Elemente mit Quelltext

    tuv[@lang='de']/seg (in Bezug auf das übergeordnete Element //tu)

  • Nicht übersetzbare Inline-Elemente

    Alle Elemente in Quelle oder Ziel werden als übersetzbare Inline-Elemente betrachtet, es sei denn, sie werden hier als nicht übersetzbare Inline-Elemente angegeben.

  • Kontext-Key

    Geben Sie einen Kontextschlüssel an, der mit dem Segment in das Translation Memory gespeichert wird und für den Kontextabgleich verwendet wird.

  • Kontexthinweis

    Importieren Sie Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, würden sie als &quot; dargestellt, das Zeichen Σ würde als &#x3A3; dargestellt, verwenden Sie &quot;,&#x3A3;. & und < werden immer als &amp; und &lt; exportiert.

  • In Phrase TMS-Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsing für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.

  • HTML-Teilfilter verwenden 

    Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den HTML-Dateiimport-Einstellungen verwendet werden. Absatz-Tags <p> erstellen neue Segmente, auch wenn Segment Mehrsprachige XML nicht ausgewählt ist.

  • HTML-Teilfilter verwenden

    Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den HTML-Dateiimport-Einstellungen verwendet werden.

  • Mehrsprachige XML-Datei segmentieren

    Text wird durch eine allgemeine Segmentierungsregel segmentiert, anstatt ein Segment pro Zelle.

    Vorsicht

    Die Anwendung von Segment Mehrsprachige XML auf eine Datei, die Zieltext enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Quelle im Vergleich zum Ziel führen.

  • Segmentstatus für nicht leeres Ziel festlegen 

    Wählen Sie den Standardbestätigungsstatus und ob bestätigte Segmente automatisch zum TM hinzugefügt werden.

  • XSLT-Vorschaudatei erstellen

    .XSL-Stylesheet kann hochgeladen werden und eine lesbare Vorschau-Datei daraus generiert werden.

Beispiel:

Wenn eine mehrsprachige .XML einen Namensraum enthält, könnte der XPath wie folgt aussehen:

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //*[local-name()='trans-unit']

  • Elemente mit Quelltext

    *[local-name()='source']

  • Elemente mit Zieltext

    *[local-name()='target']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.