Dateiimport-Einstellungen

.XML - Erweiterbare Auszeichnungssprache (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für einen erfolgreichen Import.

Die Standardeinstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.

KI-Dienste können sehr effektiv dabei sein, Formatprobleme in .XML-basierten Dateien zu identifizieren.

Dateitypen

  • .XML

Import-Optionen

Einfaches Importregeln

  • Elemente

    Nur ausgewählte Elemente (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Elemente.

  • Attribute

    Nur ausgewählte Attribute (z.B. Name, Titel, Absatz) werden importiert. Ein Sternchen (*) importiert alle Attribute.

  • Übersetzbare Inline-Elemente

    Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als Übersetzbare Inline Elemente importiert.

  • Nicht übersetzbare Inline-Elemente

    Ausgewählte Inline-Elemente Name, Titel, Absatz werden in Tags umgewandelt und der Inhalt wird nicht übersetzbar sein.

    Wichtig

    Probleme mit Tags sind eine häufige Ursache für Exportfehler (z.B. Datei konnte nicht generiert werden), insbesondere bei Dateitypen wie Tabellenkalkulationen (MS Excel-basiert) und .XML. Stellen Sie immer sicher, dass Tags und Formatierungen korrekt sind, bevor Sie Dateien exportieren, indem Sie Qualitätssicherungs Prüfungen durchführen.

  • Inline-Elemente automatisch identifizieren

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.

  • Elemente (als HTML verarbeitet)

    Der ausgewählte Elementcode wird als .HTML verarbeitet. .HTML Import-Einstellungen wie Whitespace beibehalten oder Break-Tag (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.

    Verwenden Sie diese Option, wenn der Wert des ausgewählten Elements .HTML-Markup enthält. Es gilt nicht für Kinder des ausgewählten Elements, es sei denn, es ist anders angegeben.

  • Gesperrte Elemente

    Die ausgewählten Elemente werden als Gesperrt importiert.

  • Gesperrte Attribute

    Die ausgewählten Attribute werden als Gesperrt importiert.

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, würden sie als &quot; dargestellt, das Zeichen Σ würde als &#x3A3; dargestellt, verwenden Sie &quot;,&#x3A3;. & und < werden immer als &amp; und &lt; exportiert.

  • In Phrase TMS-Tags konvertieren 

    Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.

  • XML-Entitäten importieren

    XML-Entitäten in DTD-Deklaration werden zur Übersetzung importiert.

  • Individuelle allgemeine Entitäten erweitern

  • Kommentare importieren

    Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Optionen (als HTML verarbeitet) angegeben.

  • Unterelemente von der Segmentierung ausschließen

    Wählen Sie aus, um Segmentierung innerhalb von XML-Paar-Tags oder Unterelementen zu verhindern. Dies ist nützlich, wenn das XML verschachtelte Strukturen enthält, bei denen die Segmentierung die logische Bedeutung des Textes beeinträchtigen würde.

  • XSLT-Vorschau-Datei erstellen

    Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.

XML-Einstellungen mit XPath

Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in einfachen Importregeln nicht verfügbar sind.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Vertrautheit mit XPath wird empfohlen, bevor Sie es verwenden.

Kontexthinweis, Kontext-Key und Max. Zielsprachelänge werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.

  • Kontext-Key

    Konstituiert gegebenenfalls TM-Kontext (101% Übereinstimmungen).

  • Kontexthinweis

    Importiere Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich Kontexthinweis im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Leer lassen, um Leerzeichen in den Elementen beizubehalten. Wende xml:whitespace='preserve'. //* an, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.

  • Von der Segmentierung ausgeschlossene Knoten

    Gib XML-Elemente oder Attribute an, die nicht segmentiert werden sollen. Gib einen XPath-Ausdruck ein, der die auszuschließenden Knoten identifiziert. Jeder Text, der aus diesen Knoten extrahiert wird, bleibt als ein einzelnes Segment erhalten, anstatt in kleinere Einheiten aufgeteilt zu werden.

    Gib //element[@attr='value'] ein, um alle <element> Knoten, die das Attribut attr="value" enthalten, von der Segmentierung auszuschließen.

HTML-Vorschau mit XSLT-Stylesheet

Die XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente in .HTML-Format für In-Kontext-Vorschau Zwecke zu transformieren. Dementsprechend kommen Vorschau-Dateien, die über Vorschau-Übersetzung im Dokument Menü heruntergeladen werden, mit HTML-Erweiterung. Phrase unterstützt derzeit XSLT 2.0.

Die für die Vorschau verwendete XSLT muss auf dem Ziel und nicht auf der Quelle basieren.

Klicke Datei auswählen, um ein Stylesheet zu importieren.

Klicke XSLT herunterladen, um das Stylesheet nach dem Dateiimport herunterzuladen.

CDATA in XML-Datei

CDATA bedeutet Zeichen-Daten und wird als Textblöcke definiert, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie &lt;, &gt; und &amp; erfordern das Tippen und sind im Markup allgemein schwer zu lesen. In solchen Fällen kann der CDATA-Bereich verwendet werden.

Wenn CDATA eingebettetes .HTML enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgeführt werden.

Wenn die Quelldatei CDATA enthält und das Segment XML verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.

CDATA wird nur segmentiert, wenn es einen klaren Hinweis auf einen Segmentwechsel gibt, wie z.B. Interpunktion oder Leerzeichen.

Quelle:

<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>

Ziel:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>

Die abgeschlossene Datei ist gültig .XML und der XML-Viewer zeigt den Text korrekt als Übersetzbarer Text A. Übersetzbarer Text B an.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für Wordpress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase-Tags konvertieren

    (\[[^\]]++\])++

Wählen Sie Weißräume beibehalten unter HTML Einstellungen.

Mehrsprachiges XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert, wobei die Sprachen vor dem Import zugeordnet werden. Sie werden mit multilingual_xml.png in der Jobs-Tabelle dargestellt. Wenn in mehrere Zielsprache importiert, besteht die Abgeschlossen Datei aus allen Zielsprache.

Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Ziel-Elemente für alle Absätze enthalten, auch wenn das Ziel leer ist. Wenn die Quell- und Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung maßgeblich.

Einzelne Sprachelemente müssen alle Nachkommen des gleichen trans-unit-Elements sein, und eine Sprache kann nicht in der anderen enthalten sein. Quell- und Zielinhalt können nicht in Attributwerten gespeichert werden. Wenn mehrere Elemente dem XPath für Quelle oder Ziel innerhalb des trans-unit-Elements entsprechen, wird nur das erste für die Übersetzung importiert.

  • Beim Erstellen eines Jobs wählen Sie Mehrsprachige XML im Dateityp-Bereich aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard .XML importiert.

  • Tag-Inhalt der Quell-.XML-Datei kann im Editor visualisiert werden, indem Sie auf Tags erweitern im Werkzeug-Menü klicken und bearbeitet werden, indem Sie auf F2 klicken.

Beispiel:

Beispiel für teilweise übersetzten Text aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder des gleichen <tu>-Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="ein weiterer Kontexthinweis" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Für den Import von mehrsprachigen .XML-Dateien muss die XPath Abfragesprache verwendet werden. Siehe Beispiel oben zur Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

  • Elemente mit Quell- und Zielunterelementen

    //tu

  • Elemente mit Quelltext

    tuv[@lang='en']/seg (in Bezug auf das übergeordnete Element //tu)

  • Nicht übersetzbare Inline-Elemente

    Alle Elemente in der Quelle oder dem Ziel gelten als übersetzbare Inline-Elemente, es sei denn, sie werden hier als nicht übersetzbare Inline-Elemente angegeben.

  • Kontext-Key

    Geben Sie einen Kontextschlüssel an, der mit dem Segment im Translation Memory gespeichert wird und für den Kontext des Treffers verwendet wird.

  • Kontexthinweis

    Importiere Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, würden sie als &quot; dargestellt, das Zeichen Σ würde als &#x3A3; dargestellt, verwenden Sie &quot;,&#x3A3;. & und < werden immer als &amp; und &lt; exportiert.

  • In Phrase TMS-Tags konvertieren 

    Wenden Sie reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Wenn ein Segment Inline-Elemente enthält, wird das ICU-Parsen für dieses Segment übersprungen. Segmente ohne Inline-Elemente werden normal geparst.

  • HTML-Teilfilter verwenden 

    Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden. Absatz-Tags <p> erstellen neue Segmente, auch wenn Mehrsprachige XML segmentieren nicht ausgewählt ist.

  • HTML-Teilfilter verwenden

    Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden.

  • Mehrsprachige XML segmentieren

    Text wird durch eine allgemeine Segmentierungsregel segmentiert, anstatt ein Segment pro Zelle zu erstellen.

    Vorsicht

    Das Anwenden von Segment mehrsprachiges XML auf eine Datei, die Zieltext enthält, kann zu einer unterschiedlichen Anzahl von Segmenten in der Ausgangs- und Zielsprache führen.

  • Segmentstatus für nicht leeres Ziel festlegen 

    Wählen Sie den Standardbestätigungsstatus aus und ob bestätigte Segmente automatisch zur TM hinzugefügt werden.

  • XSLT-Vorschau-Datei erstellen

    Eine .XSL-Stylesheet kann hochgeladen werden, und eine lesbare Vorschau-Datei kann daraus generiert werden.

Beispiel:

Wenn ein mehrsprachiges .XML einen Namensraum enthält, könnte der XPath folgendermaßen aussehen:

  • Elemente mit Quell- und Zielunterelementen

    //*[local-name()='trans-unit']

  • Elemente mit Quelltext

    *[local-name()='source']

  • Elemente, die Zieltext enthalten

    *[local-name()='target']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.