Paramètres d’importation de fichiers

.XML - Extensible Markup Language (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Le format de fichier .XML n'est pas conçu pour la traduction et nécessite des paramètres supplémentaires pour importer correctement.

Les paramètres par défaut sont marqués d'un astérisque (*) et importeront tous les éléments XML pour traduction. Importer options peuvent être utilisées pour modifier le comportement importer.

Les chatbots IA peuvent être très efficaces pour identifier les problèmes de format dans les fichiers basés sur .XML.

Types de fichiers

  • .XML

Options d'importation

Règles d'importation simples

  • Éléments

    Seuls les éléments sélectionnés (c.-à-d. nom, titre, para) sont importés. Un astérisque (*) importe tous les éléments.

  • Attributs

    Seuls les attributs sélectionnés (c.-à-d. nom, titre, para) sont importés. Un astérisque (*) importe tous les attributs.

  • Éléments inline traduisibles

    Si l ' option < < Identifier automatiquement les éléments internes > > est sélectionnée, tous les éléments du texte traduisible sont importés sous forme d ' éléments traduisibles internes.

  • Éléments inline à ne pas traduire

    Les éléments inline sélectionnés name, title, para seront convertis en tags et le contenu ne sera pas traduisible.

    Important

    Les problèmes de tags sont une cause fréquente d'erreurs d'exporter, en particulier pour les types de fichiers tels que les tableurs (basés sur MS Excel) et les fichiers .XML. Assurez-vous toujours que tags et formatage sont corrects avant d'exporter des fichiers en exécutant des contrôles assurance qualité.

  • Identifier automatiquement les éléments internes

    Les éléments voisins des nœuds de texte seront automatiquement convertis en tags internes.

  • Éléments (traités au format HTML)

    Le code de l'élément sélectionné est traité comme .HTML. Des paramètres importer .HTML tels que Conserver les espaces blancs ou Balise briser (<br/>) crée un nouveau segment peut être utilisé pour ces éléments.

    Utilisez cette option lorsque la valeur de l'élément sélectionné contient un balisage .HTML. Il ne s'applique pas aux enfants de l'élément sélectionné, sauf indication contraire.

  • Éléments verrouillés

    Les éléments sélectionnés seront importés comme verrouillés

  • Attributs verrouillés

    Les attributs sélectionnés seront importés comme verrouillés

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Les fichiers avec des messages ICU ne peuvent contenir aucun élément interne.

  • Importer les entités XML

    Les entités XML de la Déclaration DTD seront importées pour traduction.

  • Segmenter XML

    Désélectionner si segmentation non souhaitée.

  • Importer les commentaires

    Les commentaires ne sont pas importés si les éléments sont traités comme HTML comme indiqué dans l'option Éléments (transformés en HTML).

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par des virgules) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés comme &quot;, le caractère Σ serait représenté comme &#x3A3; utilisez &quot;,&#x3A3; . & et < sont toujours exportés comme &amp; et &lt; respectivement.

Paramètres XML utilisant XPath

L'utilisation de la langue de requête XPath permet de créer des règles importer complexes et certaines fonctionnalités supplémentaires non disponibles dans les règles importer simples.

L'expression XPath doit définir les éléments et/ou attributs dont le texte/valeur doit être traduit et non le nœud textuel proprement dit.

Il est recommandé de se familiariser avec XPath avant de l’utiliser.

Note de contexte, Clé de contexte et longueur cible max. ne seront pas traitées pour les fichiers contenant plus de 10 000 éléments XML.

  • Clé de contexte

    Constitue le contexte MT (correspondances 101 %) le cas échéant.

  • Note de contexte

    Importez des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importez des éléments ou la longueur max de la cible pour chaque élément. La limite de caractères pour chaque segment est affichée dans le volet Note de contexte à l’intérieur de l’éditeur. Tout caractère dépassant la limite est surligné en rouge.

  • Conserver les espaces blancs

    Keep empty pour conserver les espaces blancs dans les éléments. Appliquez xml:whitespace='preserve'. //* pour préserver tous les espaces blancs dans tous les éléments, ou utilisez une expression XPath arbitraire.

Aperçu HTML avec feuille de style XSLT

Langue XSLT (Extensible Stylesheet Langue Transformions formations) peut être utilisé pour transformer des documents .XML en format .HTML à des fins d'aperçu en contexte. Les fichiers aperçus téléchargés via la traduction aperçu dans le menu Document sont donc accompagnés d ' une extension HTML. Phrase prend actuellement en charge XSLT 2.0.

Cliquez sur Choisir un fichier pour importer une feuille de style.

Cliquer sur Télécharger XSLT pour télécharger la feuille de style après importation fichier.

CDATA dans le fichier XML

CDATA signifie Données caractères et est défini comme des blocs de texte qui ne sont pas traités par l'analyseur, mais qui sont reconnus comme balisage. Les entités prédéfinies telles que &lt;, &gt; et &amp; nécessitent une saisie et sont généralement difficiles à lire dans le balisage. Dans de tels cas, la section CDATA peut être utilisée.

Si CDATA contient un fichier .HTML intégré, les éléments XML correspondants doivent être répertoriés sous Éléments (transformés en HTML).

Si le fichier source contient CDATA et que le segment XML est utilisé, CDATA est ajouté à chaque segment du fichier Terminé.

CDATA ne sera segmenté que s'il existe une indication effacée d'un saut de segment tel que la ponctuation ou l'espacement.

Source :

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Cible :

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

Le fichier terminé est valide .XML et la visionneuse XML affichera correctement le texte sous la forme Texte traduisible A. Texte traduisible B.

Paramètres spécifiques à l ' application

Wordpress XML

Paramètres recommandés pour WordPress XML :

  • XML

    XPath

  • Éléments et attributs

    //*[local-name()='encoded']|//description|//title

  • Éléments (traités au format HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en balises Phrase

    (\[[^\]]++\])++

Sélectionnez Conserver les espaces sous paramètres HTML.

XML multilingue

Les fichiers multilingues sont importés sous forme de plusieurs tâches bilingues avec des langues mappées avant l'importation. Ils sont représentés avec multilingual_xml.png dans le tableau des tâches. S'il est importé dans plusieurs langues cibles, le fichier terminé est composé de toutes les langues cibles.

Phrase prend en charge les fichiers XML dont les éléments source et cible sont présents pour tous les paragraphes même si la cible est empty. Lorsque les segmentations source et cible sont différentes, la segmentation source est déterminante.

Les éléments de langue individuels doivent tous être les descendants du même élément de transunité et une langue ne peut pas être contenue dans l'autre. Les contenus source et cible ne peuvent pas être stockés dans des valeurs d'attributs. Si plusieurs éléments correspondance au XPath pour la source ou la cible à l'intérieur de l'élément trans-unit, seul le premier est importé pour traduction.

  • Lors de la création d'une tâche, sélectionnez XML multilingue dans le volet Type de fichier avant d'appliquer les Options importer. Si non spécifié, le fichier sera importé en tant que .XML standard.

  • contenu balise du fichier .XML source peut être visualisé dans l'éditeur en cliquant sur Expand tags sous le menu Outil et modifié en cliquant sur F2.

Exemple :

Exemple de texte partiellement traduit de l'anglais vers l'allemand et le français. Toutes les <tuv lang="fr">, <tuv lang="de"> et <tuv lang="fr"> sont des enfants du même <tu> élément.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texte non traduisible
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Premier segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Second segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Options d'importation

Pour importer des fichiers .XML multilingues, la langue de requête XPath doit être utilisée. Voir pour référence l'exemple ci-dessus. L'expression XPath définit les éléments dans lesquels le texte/valeur doit être traduit et non le nœud textuel proprement dit.

  • Éléments contenant des sous-éléments source et cible

    //tu

  • Éléments contenant le texte source

    tuv[@lang='en']/seg (par rapport à l'élément parent //tu)

  • Éléments contenant le texte cible

    tuv[@lang='de']/seg (par rapport à l'élément loueur de la Note de contexte pa //tu)

  • Éléments contenant le texte cible

    tuv[@lang='fr']/seg (par rapport à l'élément parent //tu)

  • Éléments inline à ne pas traduire

    Tous les éléments source ou cible sont considérés comme des éléments internes traduisibles sauf s’ils sont spécifiés ici comme des éléments internes à ne pas traduire.

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Clé de contexte

    Spécifier une clé de contexte qui est enregistrée avec le segment dans la mémoire de traduction et utilisée comme contexte de correspondance.

  • Note de contexte

    Importez des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importez des éléments ou la longueur max de la cible pour chaque élément

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par des virgules) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés comme &quot;, le caractère Σ serait représenté comme &#x3A3; utilisez &quot;,&#x3A3; . & et < sont toujours exportés comme &amp; et &lt; respectivement.

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Les fichiers avec des messages ICU ne peuvent contenir aucun élément interne.

  • Utiliser le sous-filtre HTML 

    Importe les balises HTML contenues dans le fichier. Les balises peuvent ensuite être utilisées avec les paramètres Importer fichier HTML. Les paragraph tags <p> créent de nouveaux segments même si le segment multilingue XML n’est pas sélectionné.

  • Segmenter XML multilingue

    Le texte est segmenté par une règle de segmentation générale plutôt que par un segment par cellule.

    Caution

    L ' application du segment XML multilingue à un fichier contenant un texte cible peut entraîner un nombre de segments dans la source et dans la cible différents.

  • Définir le statut des segments non vides de la cible 

    Sélectionnez statut de confirmation par défaut et si les segments confirmés sont automatiquement ajoutés à MT.

Exemple :

Si un .XML multilingue contient un espace de noms, le XPath pourrait être le suivant:

  • Éléments contenant des sous-éléments source et cible

    //*[local-name()='trans-unit']

  • Éléments contenant le texte source

    *[local-name()='source']

  • Éléments contenant le texte cible

    *[local-name()='cible']

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.