Dateiimport-Einstellungen

.XML – Erweiterbare Sprache (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das Format .XML-Datei ist nicht für die Übersetzung bestimmt und erfordert zusätzliche Einstellungen, um erfolgreich importiert zu werden.

Die Standardeinstellungen sind mit einem Stern (*) markiert und importieren alle zu übersetzenden XML-Elemente. importieren können verwendet werden, um das importieren zu ändern.

KI Chatbots können Format Probleme in .XML Dateien sehr effektiv identifizieren.

Dateitypen

  • .XML

Importoptionen

Einfache Regeln importieren

  • Elemente

    Nur ausgewählte Elemente (Name, Titel, Para) werden importiert. Ein Sternchen (*) importiert alle Elemente.

  • Attribute

    Nur ausgewählte Attribute (Name, Titel, Para) werden importiert. Ein Sternchen (*) importiert alle Attribute.

  • Übersetzbare Inline-Elemente

    Wenn die Option Automatische Inline-Elemente identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als übersetzbare Inline-Elemente importiert.

  • Nicht übersetzbare Inline-Elemente

    Das ausgewählte Inline-Element Name, Titel, Para wird in Tags konvertiert, und Inhalte sind nicht übersetzbar.

  • Inline-Elemente automatisch identifizieren

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline-Tags konvertiert.

  • Elemente (als HTML verarbeitet)

    Ausgewählter Elementcode wird als .HTML verarbeitet. .HTML Einstellungen wie Leerzeichen beibehalten oder Umbruch Tag (<br/>) erzeugt neues Segment können für diese Elemente verwendet werden.

    Verwende diese Option, wenn der ausgewählte Elementwert .HTML Markup enthält. Sie gilt nicht für untergeordnete Elemente des ausgewählten Elements, sofern nicht anders angegeben.

  • Gesperrte Elemente

    Die ausgewählten Elemente werden als gesperrt importiert.

  • Gesperrte Attribute

    Die ausgewählten Attribute werden als gesperrt importiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • XML-Entitäten importieren

    XML-Entitäten in der DTD-Deklaration werden zur Übersetzung importiert.

  • XML segmentieren

    Hebe die Auswahl auf, wenn Segmentierung nicht erwünscht ist.

  • Kommentare importieren

    Kommentare werden nicht importiert, wenn Elemente gemäß der Option Elemente (als HTML verarbeitet) als HTML verarbeitet werden.

  • In Phrase TMS Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmte Texte in Tags zu konvertieren.

  • In Zeichenentitäten konvertieren

    Gib eine Liste mit Zeichen (durch Kommata getrennt) in die Output Datei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, werden diese als , das Zeichen Σ als „&#x3A3; verwenden“, „&#x3A3;“ repräsentiert. & und werden immer als „&amp;“ bzw. „&lt; exportiert.

XML Einstellungen mit XPath

Die Verwendung der Sprache XPath Query ermöglicht es, komplexe Regeln zu importieren, und einige zusätzliche Funktionen können nicht in den Regeln für den einfachen importiert werden.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den eigentlichen Textknoten.

Die Vertrautheit mit XPath wird vor der Verwendung empfohlen.

Kontexthinweis, Kontext-Key und max. Zielsprache werden nicht für Dateien mit mehr als 10.000 XML-Elementen verarbeitet.

  • Kontext-Key

    Konstituiert gegebenenfalls den TM Kontext (101% Matches).

  • Kontexthinweis

    Für jedes Element Elemente oder Kontextattribute importieren.

  • Max. Ziellänge

    Elemente oder die maximale Zielsprache für jedes Element importieren. Das Zeichenlimit für jedes Segment wird im Kontexthinweis innerhalb des Editors angezeigt. Jedes Zeichen, das den Grenzwert überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Lassen Sie dies leer, um Leerzeichen in Elementen beizubehalten. Wende xml:whitespace='preserve' an. //*, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.

HTML-Vorschau mit XSLT-Stylesheet

XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente zur kontextbezogenen Vorschau in das .HTML-Format zu transformieren. Dementsprechend werden Vorschau-Dateien, die über die Vorschau im Menü Dokument heruntergeladen werden, mit HTML-Erweiterung geliefert. Phrase unterstützt derzeit XSLT 2.0.

Klicke auf Datei auswählen, um ein Stylesheet zu importieren.

Klicke auf XSLT herunterladen, um das Stylesheet herunterzuladen, nachdem du eine Datei importiert hast.

CDATA in XML-Datei

CDATA bedeutet Zeichen und ist definiert als Textblöcke, die nicht vom Parser verarbeitet werden, sondern als Markup erkannt werden. Vordefinierte Entitäten wie &lt;, &gt; und &amp; müssen abgetippt werden und sind in der Regel schwer lesbar. In solchen Fällen kann der CDATA-Abschnitt verwendet werden.

Wenn CDATA eine eingebettete .HTML-Datei enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgeführt werden.

Wenn die Ausgangssprache CDATA enthält und das Segment XML verwendet wird, wird zu jedem Segment in der abgeschlossenen Datei CDATA hinzugefügt.

CDATA wird nur segmentiert, wenn ein Segment gelöscht wird.

Quelle:

<text><![CDATA[übersetzbar Text A. übersetzbar Text B.]]></text>

Zielsprache:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]<![CDATA[Übersetzbarer Text B.]]></text>

Die abgeschlossene Datei ist gültig als .XML, und der XML-Viewer zeigt den Text korrekt als übersetzbaren Text A. Übersetzbarer Text B an.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für WordPress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase Tags konvertieren

    (\[[^\]]++\])++

Unter HTML Einstellungen Leerzeichen beibehalten auswählen.

Mehrsprachige XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs mit Sprachen importiert, die vor dem Import zugeordnet wurden. Sie sind in der Jobtabelle mit multilingual_xml.png vertreten. Beim Import in mehrere Zielsprachen umfasst die abgeschlossene Datei alle Zielsprachen.

Phrase unterstützt XML-Dateien, bei denen Ausgangssprache und Zielsprache für alle Absätze vorhanden sind, auch wenn die Zielsprache leer ist. Wenn sich Ausgangssprache und Zielsprache unterscheiden, bestimmt die Segmentierung die Ausgangssprache.

Einzelne Sprachen müssen alle Nachkommen desselben transeinheitlichen Elements sein, und eine Sprache kann nicht in der anderen enthalten sein. Ausgangssprache und Zielsprache können nicht in Attributwerten gespeichert werden. Wenn innerhalb des Trans-Unit-Elements mehrere Elemente mit dem XPath für Ausgangssprache oder Zielsprache Match, wird nur das erste zur Übersetzung importiert.

  • Wählen Sie beim Erstellen eines Jobs mehrsprachige XML aus dem Bereich Dateityp aus, bevor Sie Importoptionen anwenden. Wenn nicht angegeben, wird die Datei als Standard-XML importiert.

  • Tag Inhalt der Ausgangssprache .XML-Datei kann im Editor angezeigt werden, indem Sie im Tool-Menü auf „Tags erweitern“ klicken und durch Klicken auf F2 bearbeitet werden.

Beispiel:

Beispiel für teilweise übersetzte Texte aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Kinder desselben <tu>Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another Kontexthinweis" Key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Importoptionen

Für den Import mehrsprachiger .XML-Dateien muss die Sprache XPath Query verwendet werden. Siehe Beispiel oben als Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den eigentlichen Textknoten.

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //tu

  • Elemente mit Quelltext

    tuv[@lang='en']/seg (in Bezug auf übergeordnetes Element //tu)

  • Elemente mit Zieltext

    tuv[@lang='de']/seg (bezüglich des Elements pa-Kontexthinweis Miete //tu)

  • Elemente mit Zieltext

    tuv[@lang='fr']/seg (in Bezug auf übergeordnetes Element //tu)

  • Nicht übersetzbare Inline-Elemente

    Alle Elemente in Ausgangssprache oder Zielsprache gelten als Übersetzbare Inline-Elemente, sofern hier nicht als nicht übersetzbares Element angegeben.

  • In Phrase TMS Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmte Texte in Tags zu konvertieren.

  • Kontext-Key

    Geben Sie einen Kontext-Key an, der mit dem Segment im Translation Memory gespeichert und für Match Kontext verwendet wird.

  • Kontexthinweis

    Für jedes Element Elemente oder Kontextattribute importieren.

  • Max. Ziellänge

    Elemente oder die maximale Zielsprache für jedes Element importieren

  • In Zeichenentitäten konvertieren

    Gib eine Liste mit Zeichen (durch Kommata getrennt) in die Output Datei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, werden diese als , das Zeichen Σ als „&#x3A3; verwenden“, „&#x3A3;“ repräsentiert. & und werden immer als „&amp;“ bzw. „&lt; exportiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • HTML-Teilfilter verwenden 

    Importiert in der Datei enthaltene HTML-Tags. Tags können dann mit den Einstellungen für HTML-Datei importiert werden. Absatz-Tags <p> erstellen neue Segmente, auch wenn Segment mehrsprachige XML nicht ausgewählt ist.

  • Mehrsprachige XML segmentieren

    Text wird durch eine allgemeine Segmentierung segmentiert und nicht durch ein Segment pro Zelle.

    Vorsicht

    Das Anwenden mehrsprachiger Segment-XML auf eine Datei mit Zielsprache kann zu einer anderen Anzahl von Segmenten in der Ausgangssprache als in der Zielsprache führen.

  • Segmentstatus für nicht leeres Ziel festlegen 

    Status der Standardbestätigung auswählen und festlegen, ob bestätigte Segmente automatisch zum TM hinzugefügt werden.

Beispiel:

Wenn eine mehrsprachige .XML Namensraum enthält, könnte der XPath der folgende sein:

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //*[local-name()='trans-unit']

  • Elemente mit Quelltext

    *[local-name()='source']

  • Elemente mit Zieltext

    *[local-name()='target']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.