Dateiimport-Einstellungen

.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das .XML-Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für den erfolgreichen Import.

Die Standardeinstellungen sind mit einem Stern (*) gekennzeichnet und importieren alle XML-Elemente zur Übersetzung. Importoptionen können verwendet werden, um das Importverhalten zu ändern.

Dateitypen

  • .XML

Importoptionen

Einfache Importregeln

  • Elemente

    Nur ausgewählte Elemente (Name, Titel, Para) werden importiert. Ein Sternchen (*) importiert alle Elemente.

  • Attribute

    Nur ausgewählte Attribute (Name, Titel, Para) werden importiert. Ein Sternchen (*) importiert alle Attribute.

  • Übersetzbare Inline-Elemente

    Wenn die Option Automatische Inline-Elemente identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als übersetzbare Inline-Elemente importiert.

  • Nicht übersetzbare Inline-Elemente

    Ausgewählter Inline-Elementname, Titel, para wird in Tags konvertiert, und Inhalte sind nicht übersetzbar.

  • Inline-Elemente automatisch identifizieren

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.

  • Elemente (als HTML verarbeitet)

    Der Code für das ausgewählte Element wird als .HTML-Datei verarbeitet. .HTML-Importeinstellungen wie Leerzeichen beibehalten oder Tag umbrechen (br/>) können für diese Elemente verwendet werden.

  • Gesperrte Elemente

    Die ausgewählten Elemente werden als Gesperrt importiert.

  • Gesperrte Attribute

    Die ausgewählten Attribute werden als Gesperrt importiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • XML-Entitäten importieren

    XML-Entitäten in der DTD-Deklaration werden zur Übersetzung importiert.

  • Segment XML

    Deaktivieren Sie die Auswahl, wenn Segmentierung nicht erwünscht ist.

  • Kommentare importieren

    Kommentare werden nicht importiert, wenn Elemente wie in der Option Elemente (als HTML verarbeitet) angegeben als HTML verarbeitet werden.

  • In Phrase TMS Tags konvertieren 

    Nutze reguläre Ausdrücke, um bestimmte Texte in Tags zu konvertieren.

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste mit Zeichenreferenzen (durch Kommata getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, werden diese als , das Zeichen Σ als „Σ Verwendung „",Σ“ repräsentiert. & und werden immer als „& bzw. < exportiert.

XML-Einstellungen mit XPath

Die Verwendung der XPath-Abfragesprache ermöglicht die Erstellung komplexer Importregeln und einiger zusätzlicher Funktionen, die in normalen Importregeln nicht verfügbar sind.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den eigentlichen Textknoten.

Die Vertrautheit mit XPath wird vor der Verwendung empfohlen.

Kontexthinweis, Kontextschlüssel und max. Ziellänge werden für Dateien mit mehr als 10.000 XML-Elementen nicht verarbeitet.

  • Kontextschlüssel

    Konstituiert gegebenenfalls den TM-Kontext (101%-Matches).

  • Kontexthinweis

    Importieren Sie Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Kontexthinweisbereich im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Lassen Sie dies leer, um Leerzeichen in Elementen beizubehalten. Verwende xml:whitespace='preserve'. //*, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.

HTML-Vorschau mit XSLT-Stylesheet

XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente für die kontextbezogene Vorschau in das .HTML-Format zu transformieren. Dementsprechend werden Vorschaudateien, die über die Vorschauübersetzung im Dokumentenmenü heruntergeladen werden, mit HTML-Erweiterung geliefert. Phrase unterstützt derzeit XSLT 2.0.

Klicke auf Datei auswählen, um ein Stylesheet zu importieren.

Klicke auf XSLT herunterladen, um das Stylesheet nach dem Dateiimport herunterzuladen.

CDATA in XML-Datei

CDATA bedeutet Zeichendaten und ist definiert als Textblöcke, die nicht vom Parser verarbeitet werden, sondern als Markup erkannt werden. Vordefinierte Entitäten wie <, > und & müssen abgetippt werden und sind in der Regel schwer in der Aufzeichnung zu lesen. In solchen Fällen kann der CDATA-Abschnitt verwendet werden.

Wenn CDATA eine eingebettete .HTML enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgeführt werden.

Wenn die Quelldatei CDATA enthält und die Segment-XML verwendet wird, wird CDATA zu jedem Segment in der abgeschlossenen Datei hinzugefügt.

CDATA wird nur segmentiert, wenn ein Segmentumbruch wie Interpunktion oder Abstand eindeutig angezeigt wird.

Quelle:

<text><![CDATA[Übersetzbarer Text A. Übersetzbarer Text B.]]></text>

Ziel:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]></text>

Die abgeschlossene Datei ist eine gültige XML-Datei, und der XML-Viewer zeigt den Text korrekt als übersetzbaren Text A an.

Anwendungsspezifische Einstellungen

Wordpress-XML

Empfohlene Einstellungen für WordPress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase-Tags konvertieren

    (\[[^\]]++\])++

Wählen Sie unter HTML-Einstellungen Leerzeichen beibehalten aus.

Mehrsprachige XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs importiert und vor dem Import Sprachen zugeordnet. Sie werden mit multilingual_xml.png in der Jobtabelle dargestellt. Beim Import in mehrere Zielsprachen besteht die Completed-Datei aus allen Zielsprachen.

Phrase unterstützt XML-Dateien, die sowohl Quell- als auch Zielelemente für alle Absätze enthalten, auch wenn das Ziel leer ist. Wenn sich Quell- und Zielsegmentierung unterscheiden, wird die Quellsegmentierung bestimmt.

Einzelne Sprachelemente müssen alle Nachkommen desselben Trans-Unit-Elements sein, und eine Sprache darf nicht in der anderen enthalten sein. Ausgangs- und Zielinhalte können nicht in Attributwerten gespeichert werden. Wenn innerhalb des Trans-Unit-Elements mehrere Elemente mit dem XPath für Quelle oder Ziel übereinstimmen, wird nur das erste zur Übersetzung importiert.

  • Wählen Sie beim Erstellen eines Jobs mehrsprachige XML im Bereich Dateityp aus, bevor Sie Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard-XML importiert.

  • Tag-Inhalte der .XML-Quelldatei können im Editor angezeigt werden, indem Sie im Tool-Menü auf „Tags erweitern“ klicken und mit F2 bearbeitet werden.

Beispiel:

Beispiel für teilweise übersetzte Texte aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, < tuv lang="de"> und <tuv lang="fr"> si nd Kinder desselben <tu>Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Importoptionen

Für den Import mehrsprachiger .XML-Dateien muss die XPath-Abfragesprache verwendet werden. Siehe Beispiel oben als Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den eigentlichen Textknoten.

  • Elemente mit Unterelementen in Quell- und Zieltext

    //tu

  • Elemente mit Quelltext

    tuv[@lang='en']/seg (bezogen auf das übergeordnete Element //tu)

  • Elemente mit Zieltext

    tuv[@lang='de']/seg (bezogen auf das Element paContext note rent //tu)

  • Elemente mit Zieltext

    tuv[@lang='fr']/seg (bezogen auf das übergeordnete Element //tu)

  • Nicht übersetzbare Inline-Elemente

    Alle Elemente im Quell- oder Zieltext gelten als übersetzbare Inline-Elemente, sofern hier nicht als nicht übersetzbare Inline-Elemente angegeben.

  • In Phrase TMS Tags konvertieren 

    Nutze reguläre Ausdrücke, um bestimmte Texte in Tags zu konvertieren.

  • Kontextschlüssel

    Gib einen Kontextschlüssel an, der mit dem Segment im Translation Memory gespeichert und für Match-Kontext verwendet wird.

  • Kontexthinweis

    Importieren Sie Elemente oder Kontextattribute für jedes Element.

  • Max. Ziellänge

    Elemente importieren oder die maximale Ziellänge für jedes Element

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste mit Zeichenreferenzen (durch Kommata getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, werden diese als , das Zeichen Σ als „Σ Verwendung „",Σ“ repräsentiert. & und werden immer als „& bzw. < exportiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • HTML-Teilfilter verwenden 

    Importiert in der Datei enthaltene HTML-Tags. Tags können dann mit HTML-Dateiimporteinstellungen verwendet werden. Absatz-Tags <p> erstellen neue Segmente, auch wenn das Segment Multilingual XML abgewählt ist.

  • Segment mehrsprachige XML

    Text wird durch eine allgemeine Segmentierungsregel segmentiert und nicht durch ein Segment pro Zelle.

    Vorsicht

    Wenn Sie Segment-Mehrsprachigkeits-XML auf eine Datei anwenden, die Zieltext enthält, kann dies im Ausgangstext zu einer anderen Anzahl von Segmenten als im Zieltext führen.

  • Segmentstatus für nicht leeres Ziel festlegen 

    Wählen Sie den Standardbestätigungsstatus aus und ob bestätigte Segmente automatisch zum TM hinzugefügt werden.

Beispiel:

Wenn eine mehrsprachige .XML Namensraum enthält, könnte der XPath der folgende sein:

  • Elemente mit Unterelementen in Quell- und Zieltext

    //*[local-name()='trans-unit']

  • Elemente mit Quelltext

    *[local-name()='source']

  • Elemente mit Zieltext

    *[local-name()='target']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.