Dateiimport-Einstellungen

.XML - Extensible Markup Language (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Das Format .XML-Datei ist nicht für die Übersetzung konzipiert und erfordert zusätzliche Einstellungen, um erfolgreich importiert zu werden.

Standard-Einstellungen sind mit einem Stern (*) markiert und importieren alle XML-Elemente zur Übersetzung. importieren können verwendet werden, um das importieren zu ändern.

KI Chatbots können Format Probleme in .XML Dateien sehr effektiv identifizieren.

Dateitypen

  • .XML

Import-Optionen

Einfache Regeln importieren

  • Elemente

    Es werden nur ausgewählte Elemente (Name, Titel, Para) importiert. Ein Sternchen (*) importiert alle Elemente.

  • Attribute

    Es werden nur ausgewählte Attribute (Name, Titel, Para) importiert. Ein Sternchen (*) importiert alle Attribute.

  • Übersetzbare Inline-Elemente

    Wenn die Option Inline-Elemente automatisch identifizieren ausgewählt ist, werden alle Elemente im übersetzbaren Text als übersetzbare Inline-Elemente importiert.

  • Nicht übersetzbare Inline-Elemente

    Der Name, Titel, Para des ausgewählten Inline-Elements wird in Tags konvertiert, und Inhalte sind nicht übersetzbar.

    Wichtig

    Probleme mit tags sind eine häufige Ursache für Fehler, die exportiert werden, insbesondere bei Dateitypen wie Tabellenkalkulationen (MS-Excel-basiert) und .XML. Stelle vor dem Export von Dateien stets sicher, dass tags und Formatierungen korrekt sind, indem du Qualitätssicherungen durchführst.

  • Inline-Elemente automatisch identifizieren

    Elemente, die Nachbarn von Textknoten sind, werden automatisch in Inline tags konvertiert.

  • Elemente (als HTML verarbeitet)

    Der Code des ausgewählten Elements wird als .HTML verarbeitet. .HTML Einstellungen wie Leerzeichen beibehalten oder Tag umbrechen (<br/>) erstellt neues Segment können für diese Elemente verwendet werden.

    Verwende diese Option, wenn der ausgewählte Elementwert ein HTML-Markup enthält. Sie gilt nicht für untergeordnete Elemente des ausgewählten Elements, sofern nicht anders angegeben.

  • Gesperrte Elemente

    Die ausgewählten Elemente werden als gesperrt importiert.

  • Gesperrte Attribute

    Die ausgewählten Attribute werden als gesperrt importiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • XML-Entitäten importieren

    XML-Entitäten in der DTD-Deklaration werden zur Übersetzung importiert.

  • XML segmentieren

    Deaktiviere die Auswahl, wenn Segmentierung nicht erwünscht ist.

  • Kommentare importieren

    Kommentare werden nicht importiert, wenn Elemente wie in der Option Elemente (als HTML verarbeitet) angegeben als HTML verarbeitet werden.

  • In Phrase TMS-Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • In Zeichenentitäten konvertieren

    Gib eine Liste mit Zeichen (durch Kommata getrennt) in die Output Datei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, würden diese als „&quot;“ repräsentiert, das Zeichen Σ würde als „&#x3A3;“ repräsentiert werden und „&quot;“ verwenden. & und werden immer als „&amp;“ bzw. „&lt;“ exportiert.

XML Einstellungen mit XPath

Durch die Verwendung der Sprache XPath Query können komplexe Regeln importiert werden, und einige zusätzliche Funktionen können nicht in Regeln importiert werden.

Der XPath-Ausdruck sollte die Elemente und/oder Attribute definieren, deren Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

Vertrautheit mit XPath wird vor der Verwendung empfohlen.

Kontexthinweis, Kontext-Key und max. Zielsprache werden für Dateien mit mehr als 10.000 XML-Elementen nicht verarbeitet.

  • Kontext-Key

    Konstituiert gegebenenfalls TM-Kontext (101% Matches).

  • Kontexthinweis

    Elemente oder Kontextattribute für jedes Element importieren.

  • Max. Ziellänge

    Importiere Elemente oder die maximale Ziellänge für jedes Element. Das Zeichenlimit für jedes Segment wird im Bereich Kontexthinweis im Editor angezeigt. Jedes Zeichen, das das Limit überschreitet, wird rot hervorgehoben.

  • Leerzeichen beibehalten

    Keep empty, um Leerzeichen in Elementen beizubehalten. Wende xml:whitespace='preserve'. / / * an, um alle Leerzeichen in allen Elementen beizubehalten, oder verwende einen beliebigen XPath-Ausdruck.

HTML-Vorschau mit XSLT-Stylesheet

XSLT-Sprache (Extensible Stylesheet Language Transformations) kann verwendet werden, um .XML-Dokumente für Zwecke der kontextbezogenen Vorschau in .HTML-Format zu transformieren. Dementsprechend werden Vorschau-Dateien, die über die Vorschau im Menü Dokument heruntergeladen werden, mit HTML-Erweiterung geliefert. Phrase unterstützt derzeit XSLT 2.0.

Klicke auf Datei auswählen, um ein Stylesheet zu importieren.

Klicke auf XSLT herunterladen, um das Stylesheet herunterzuladen, nachdem die Datei importiert wurde.

CDATA in XML-Datei

CDATA bedeutet Zeichen und wird definiert als Textblöcke, die nicht vom Parser verarbeitet werden, sondern als Auszeichnung erkannt werden. Vordefinierte Entitäten wie &lt;, &gt; und &amp; müssen eingegeben werden und sind in der Regel schwer in der Auszeichnung zu lesen. In solchen Fällen kann der CDATA-Abschnitt verwendet werden.

Wenn CDATA eingebettete HTML-Dateien enthält, sollten die entsprechenden XML-Elemente unter Elemente (als HTML verarbeitet) aufgelistet werden.

Wenn die Ausgangssprache CDATA enthält und die Segment XML verwendet wird, werden zu jedem Segment in der Abgeschlossen-Datei CDATA hinzugefügt.

CDATA wird nur segmentiert, wenn ein Segment gelöscht wird.

Quelle:

<text><![CDATA[übersetzbar Text A. übersetzbar Text B.]]></text>

Ziel:

<text><![CDATA[Übersetzbarer Text A.]]><![CDATA[ ]]><![CDATA[Übersetzbarer Text B.]]></text>

Die Abgeschlossene Datei ist eine gültige .XML-Datei, und der XML-Viewer zeigt den Text korrekt als übersetzbaren Text A an. Übersetzbarer Text B.

Anwendungsspezifische Einstellungen

Wordpress XML

Empfohlene Einstellungen für WordPress XML:

  • XML

    XPath

  • Elemente & Attribute

    //*[local-name()='encoded']|//description|//title

  • Elemente (als HTML verarbeitet)

    //*[local-name()='encoded']|//description|//title

  • In Phrase-Tags konvertieren

    (\[[^\]]++\])++

Wähle unter HTML Einstellungen Leerzeichen beibehalten aus.

Mehrsprachige XML

Mehrsprachige Dateien werden als mehrere zweisprachige Jobs mit Sprachen importiert, die vor dem Import zugeordnet wurden. Sie werden in der Jobtabelle mit multilingual_xml.png dargestellt. Beim Import in mehrere Zielsprachen besteht die Abgeschlossene Datei aus allen Zielsprachen.

Phrase unterstützt XML-Dateien, bei denen in allen Absätzen sowohl Ausgangssprache als auch Zielsprache vorhanden sind, auch wenn die Zielsprache empty ist. Wenn sich Ausgangssprache und Zielsprache unterscheiden, ist die Segmentierung der Ausgangssprache bestimmend.

Einzelne Sprachen müssen allesamt Nachkommen desselben transeinheitlichen Elements sein, und eine Sprache kann nicht in der anderen enthalten sein. Inhalte in Ausgangssprache und Zielsprache können nicht in Attributwerten gespeichert werden. Beim Match mehrerer Elemente mit dem XPath für Ausgangssprache oder Zielsprache innerhalb des Trans-Unit-Elements wird nur das erste zur Übersetzung importiert.

  • Beim Erstellen eines Jobs mehrsprachige XML aus dem Dateityp-Bereich auswählen, bevor du Importoptionen anwendest. Wenn nicht angegeben, wird die Datei als Standard-XML importiert.

  • Tag Inhalt der Ausgangssprache .XML-Datei kann im Editor visualisiert werden, indem du im Tool Menü auf Tags erweitern klickst und durch Klicken auf F2 bearbeitet wirst.

Beispiel:

Beispiel für teilweise übersetzte Texte aus dem Englischen ins Deutsche und Französische. Alle <tuv lang="en">, <tuv lang="de"> und <tuv lang="fr"> sind Elemente desselben <tu>Elements.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nicht übersetzbarer Text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>erstes Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes Segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Zweites Segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Import-Optionen

Um mehrsprachige .XML-Dateien zu importieren, muss die Sprache XPath Query verwendet werden. Siehe obiges Beispiel als Referenz. Der XPath-Ausdruck definiert die Elemente, in denen der Text/Wert übersetzt werden soll, und nicht den tatsächlichen Textknoten.

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //tu

  • Elemente mit Quelltext

    tuv[@lang='en']/seg (in Bezug auf übergeordnetes Element / /tu)

  • Elemente mit Zieltext

    tuv[@lang='de']/seg (in Bezug auf das Element pa-Kontexthinweis Miete / /tu)

  • Elemente mit Zieltext

    tuv[@lang='fr']/seg (in Bezug auf übergeordnetes Element / / tu)

  • Nicht übersetzbare Inline-Elemente

    Alle Elemente in Ausgangssprache oder Zielsprache werden als übersetzbare Inline-Elemente betrachtet, sofern sie hier nicht als nicht übersetzbares Element angegeben werden.

  • In Phrase TMS-Tags konvertieren 

    Wende reguläre Ausdrücke an, um bestimmten Text in Tags zu konvertieren.

  • Kontext-Key

    Gib einen Kontext-Key an, der mit dem Segment im Translation Memory gespeichert und für Match Kontext verwendet wird.

  • Kontexthinweis

    Elemente oder Kontextattribute für jedes Element importieren.

  • Max. Ziellänge

    Elemente oder die maximale Zielsprache für jedes Element importieren

  • In Zeichenentitäten konvertieren

    Gib eine Liste mit Zeichen (durch Kommata getrennt) in die Output Datei ein.

    Beispiel:

    Wenn Anführungszeichen (“) erforderlich sind, würden diese als „&quot;“ repräsentiert, das Zeichen Σ würde als „&#x3A3;“ repräsentiert werden und „&quot;“ verwenden. & und werden immer als „&amp;“ bzw. „&lt;“ exportiert.

  • ICU-Nachrichten analysieren

    ICU-Nachrichten werden automatisch in Tags konvertiert. Dateien mit ICU-Nachrichten können keine Inline-Elemente enthalten.

  • HTML-Teilfilter verwenden 

    Importiert die in der Datei enthaltenen HTML-Tags. Tags können dann mithilfe der HTML--Dateiimport-Einstellungen verwendet werden. Paragraph tags <p> werden neue Segmente erstellen, auch wenn Segment mehrsprachige XML nicht ausgewählt ist.

  • Mehrsprachige XML-Datei segmentieren

    Text wird durch eine allgemeine Segmentierung segmentiert und nicht durch ein Segment pro Zelle.

    Vorsicht

    Das Anwenden von Segment mehrsprachiger XML auf eine Datei mit Zielsprache kann zu einer anderen Anzahl von Segmenten in der Ausgangssprache als in der Zielsprache führen.

  • Segmentstatus für nicht leeres Ziel festlegen 

    Status Standardbestätigung auswählen und festlegen, ob bestätigte Segmente automatisch zum TM hinzugefügt werden.

Beispiel:

Wenn eine mehrsprachige .XML Namespace enthält, könnte der XPath der folgende sein:

  • Elemente mit Unterelementen in Ausgangs- und Zieltext

    //*[local-name()='trans-unit']

  • Elemente mit Quelltext

    *[local-name()='Ausgangssprache']

  • Elemente mit Zieltext

    *[local-name()='target']

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.