Dateiimport-Einstellungen

.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Die .XML Dateiformat ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen für eine erfolgreiche importieren.

Die Standardeinstellungen sind mit einem Sternchen (*) gekennzeichnet und importieren alle XML-Elemente für die Übersetzung. Importoptionen können verwendet werden, um das Verhalten der importieren zu ändern.

Dateitypen

  • .XML

Import-Optionen

Klare importieren Regeln

  • Elemente

    Es werden nur ausgewählt Elemente (z. B. Name, Titel, Absatz) importiert. Ein Sternchen (*)importiert alle Elemente.

  • Attribute

    Es werden nur ausgewählt Attribute (z. B. Name, Titel, Absatz) importiert. Ein Sternchen (*)importiert alle Attribute.

  • Übersetzbar Inline-Elementen

    Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im zu übersetzenden Text als Übersetzbar Inline-Elemente importiert.

  • nicht zu übersetzen Inline-Elementen

    Ausgewählte Inline-Element Name, Titel, Absatz werden in Tags umgewandelt und Inhalt sind nicht übersetzbar.

  • Automatisches Identifizieren von Inline-Elementen

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.

  • Elemente (als HTML verarbeitet)

    Der Code des ausgewählten Elements wird als .HTML verarbeitet. HTML-Importeinstellungen wie "Leerzeichen beibehalten" oder "Umbruch Tag (<br/>) erstellen neu Segment für diese Elemente verwendet werden können.

  • Gesperrte Elemente

    Die ausgewählt Elemente werden als Gesperrtimportiert.

  • Gesperrte Attribute

    Die ausgewählt Attribute werden als Gesperrtimportiert.

  • Analysieren von ICU-Meldungen

    Meldungen auf der Intensivstation werden automatisch in Tags umgewandelt. Dateien mit ICU-Meldungen dürfen keine Inline-Elemente enthalten.

  • Importieren von XML-Entitäten

    XML-Entitäten in der DTP-Deklaration werden zur Übersetzung importiert.

  • Segment XML

    Deaktivieren Sie diese Option, wenn die Segmentierung nicht erwünscht ist.

  • Importieren von Kommentaren

    Kommentare werden nicht importiert, wenn Elemente als HTML verarbeitet werden, wie in der Option Elemente (verarbeitet als HTML) angegeben.

  • In Phrase TMS Tags konvertieren

    Wenden Sie reguläre Ausdrücke an um angegebenen Text in Tags zu konvertieren.

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, werden sie als ", dargestellt, das Zeichen Σ wird als &#x3A3; verwenden Sie ",&#x3A3; . & und < werden immer als & bzw . < exportiert.

XML-Einstellungen mit XPath

Die Verwendung der XPath-Abfrage ermöglicht Sprache die Erstellung komplexer importieren Regeln und einiger zusätzlicher Funktionen, die in einfachen importieren Regeln nicht verfügbar sind.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den eigentlichen Text-Node.

Es wird empfohlen, sich vor der Verwendung mit XPath vertraut zu machen.

Kontextnotiz, Kontextschlüssel, und Max. Ziel Länge werden für Dateien mit mehr als 10.000 XML-Elementen nicht verarbeitet.

  • Kontextschlüssel

    Stellt ggf. TM Kontext (101 % Matches) dar.

  • Kontext-Hinweis

    Importieren Sie Elemente oder Kontext Attribute für jedes Element.

  • Max. Ziel Länge

    Importieren Sie Elemente oder die maximale Ziel Länge für jedes Element. Die Zeichenbeschränkung für jede Segment wird im Bereich "Kontextnotiz" im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Lassen Sie das Feld leer, um Leerzeichen in Elementen zu erhalten. Wenden Sie xml:whitespace='preserve' an. //*um alle Leerzeichen in allen Elementen beizubehalten, oder verwenden Sie einen beliebigen XPath-Ausdruck.

HTML-Vorschau mit XSLT-Stylesheet

XSLT Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML Dokumente in .HTML Format für die kontextbezogene Vorschau umzuwandeln. Dementsprechend werden Vorschaudateien, die über Vorschau Übersetzung im Menü Dokument heruntergeladen werden, mit der HTML-Erweiterung geliefert. Phrase unterstützt derzeit XSLT 2.0.

Klicken Sie auf Datei auswählen, um ein Stylesheet zu importieren.

Klicken Sie auf XSLT herunterladen, um das Stylesheet nach Datei importieren zu herunterladen.

CDATA im XML-Datei

CDATA bedeutet Character Data und ist definiert als Textblöcke, die vom Parser nicht verarbeitet, aber als Markup erkannt werden. Vordefinierte Entitäten wie <, >, und & erfordern eine Eingabe und sind im Markup im Allgemeinen schwer zu lesen. In solchen Fällen kann der Abschnitt CDATA verwendet werden.

Wenn CDATA eingebettete .HTML enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet)aufgeführt werden.

Wenn die Quelldatei CDATA enthält und die Segment-XML verwendet wird, wird CDATA für jede Segment in der Datei "Abgeschlossen" hinzugefügt.

CDATA wird nur segmentiert, wenn ein löschen Hinweis auf einen Segment Umbruch vorhanden ist, z. B. Satzzeichen oder Leerzeichen.

Quelle:

<Text><! [CDATA[Übersetzbar Text A. Übersetzbar Text B.]] ></Text>

Ziel:

<Text><! [CDATA[Übersetzbarer Text A.]] ><! [CDATA[ ]]><! [CDATA[Übersetzbarer Text B.]] ></Text>

Die Datei "Abgeschlossen" ist .XML gültig, und der XML-Viewer zeigt den Text korrekt als Übersetzbar Text A an. Übersetzbar Text B.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für Wordpress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase Tags konvertieren

    (\[[^\]]++\])++

Auswählen Behalten Sie Leerzeichen unter HTML-Einstellungen bei.

Mehrsprachiges XML

Mehrsprachige Dateien werden als mehrere zweisprachige Aufträge importiert, wobei die Sprachen vor importieren zugeordnet werden. Sie werden mit multilingual_xml.png in der Tabelle"Jobs" dargestellt. Beim Import in mehrere Zielsprachen setzt sich die Datei Abgeschlossen aus allen Zielsprachen zusammen.

Phrase unterstützt XML-Dateien, die sowohl Quelle- als auch Ziel-Elemente für alle Absätze enthalten, auch wenn die Ziel leer ist. Wenn die Quelle und die Zielsegmentierung unterschiedlich sind, ist die Quellsegmentierung entscheidend.

Einzelne Sprache-Elemente müssen alle Nachkommen desselben trans-unit-Elements sein, und eine Sprache kann nicht in der anderen enthalten sein. Quelle und Ziel Inhalt können nicht in Attribut Werten gespeichert werden. Wenn mehrere Elemente für Quelle oder Ziel innerhalb des trans-unit-Elements Match XPath enthalten sind, wird nur das erste Element für die Übersetzung importiert.

  • Wenn Sie eine Job, erstellen, wählen Sie im Bereich Dateityp die Option Mehrsprachiges XML aus, bevor Sie die Importoptionen anwenden. Wenn nicht angegeben, wird der Datei standardmäßig .XML importiert.

  • Tag-Inhalt von Quelle .XML Datei können im Editor visualisiert werden, indem Sie im Menü Tool auf Tags erweitern klicken, und mit F2bearbeiten .

Beispiel:

Beispiel für teilweise übersetzte Texte aus dem Englischen ins Deutsche und Französische. Alle <tüv lang="en">, <tüv lang="de"> und <tüv lang="fr"> sind untergeordnete Elemente desselben <tu>, -Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Erstes Segment.</seg>
  </tuv>
  <tüv lang="de">
    <seg>Erste Segment</seg>
  </tuv>
  <tüv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another Kontexthinweis" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tüv lang="de">
    <seg></seg>
  </tuv>
  <tüv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Für die importieren von mehrsprachigen .XML Dateien muss die XPath-Abfrage Sprache verwendet werden. Siehe Beispiel oben für Referenz. Der XPath-Ausdruck definiert die Elemente, in die der Text/Wert übersetzt werden soll, und nicht den eigentlichen Text-Node.

  • Elemente, die Quelle und Ziel Unterelemente enthalten

    //tu

  • Elemente, die Quelltext enthalten

    tüv[@lang='en']/seg (in Bezug auf das übergeordnete Element //tu)

  • Elemente, die Zieltext enthalten

    tüv[@lang='de']/seg (in Bezug auf die paKontextnotiz Mietelement //tu)

  • Elemente, die Zieltext enthalten

    tüv[@lang='fr']/seg (in Bezug auf das übergeordnete Element //tu)

  • nicht zu übersetzen Inline-Elementen

    Alle Elemente in Quelle oder Ziel werden Übersetzbar Inline-Elemente betrachtet, es sei denn, sie werden hier als nicht zu übersetzen Inline-Elemente angegeben.

  • In Phrase TMS Tags konvertieren

    Wenden Sie reguläre Ausdrücke an um angegebenen Text in Tags zu konvertieren.

  • Kontextschlüssel

    Geben Sie eine Kontextschlüssel an, die mit dem Segment zum Translation Memory gespeichert und für Match Kontext verwendet wird.

  • Kontext-Hinweis

    Importieren Sie Elemente oder Kontext Attribute für jedes Element.

  • Max. Ziel Länge

    Importieren von Elementen oder der maximalen Ziel Länge für jedes Element

  • In Zeichenentitäten konvertieren

    Geben Sie eine Liste von Zeichenreferenzen (durch Kommas getrennt) in die Ausgabedatei ein.

    Beispiel:

    Wenn Anführungszeichen (") erforderlich sind, werden sie als ", dargestellt, das Zeichen Σ wird als &#x3A3; verwenden Sie ",&#x3A3; . & und < werden immer als & bzw . < exportiert.

  • Analysieren von ICU-Meldungen

    Meldungen auf der Intensivstation werden automatisch in Tags umgewandelt. Dateien mit ICU-Meldungen dürfen keine Inline-Elemente enthalten.

  • Verwenden HTML-Unterfilter

    Importiert HTML-Tags, die in der Datei enthalten sind. Tags können dann mit den Einstellungen für den HTML-Dateiimport verwendet werden. Absatz Tags <p> wird auch dann erstellen neu Segmente, wenn die Option "Mehrsprachiges XML-Segment " deaktiviert ist.

  • XML mehrsprachig segmentieren

    Text wird nach einer allgemeinen Segmentierungsregel und nicht nach einem Segment pro Zelle segmentiert.

    Vorsicht

    Das Anwenden von Segment mehrsprachig XML auf eine Datei, die Zieltext enthält, kann zu einer anderen Anzahl von Segmente im Quelle führen als im Ziel.

  • Legen Sie Segment Status von nicht leeren Ziel fest

    Auswählen Standard Bestätigung Status und ob bestätigt Segmente automatisch an TM hinzugefügt werden.

Beispiel:

Wenn ein mehrsprachig .XML einen Namespace enthält, kann der XPath wie folgt aussehen:

  • Elemente, die Quelle und Ziel Unterelemente enthalten

    //*[local-name()='trans-unit']

  • Elemente, die Quelltext enthalten

    *[local-name()='source']

  • Elemente, die Zieltext enthalten

    *[local-Name()='Ziel']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.