Paramètres d’importation de fichiers

.XML - Langage de balisage extensible (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Le format de fichier .XML n'est pas conçu pour la traduction et nécessite des paramètres supplémentaires pour un import réussi.

Les paramètres par défaut sont marqués d'un astérisque (*) et importeront tous les éléments XML pour la traduction. Les options d'importation peuvent être utilisées pour modifier le comportement d'importation.

Les services d'IA peuvent être très efficaces pour identifier les problèmes de format dans les fichiers basés sur .XML.

Types de fichiers

  • .XML

Options d'importation

Règles d'importation simples

  • Éléments

    Seuls les éléments sélectionnés (c'est-à-dire nom, titre, para) sont importés. Un astérisque (*) importe tous les éléments.

  • Attributs

    Seuls les attributs sélectionnés (c'est-à-dire nom, titre, para) sont importés. Un astérisque (*) importe tous les attributs.

  • Éléments inline traduisibles

    Si l'option Identifier automatiquement les éléments inline est sélectionnée, tous les éléments dans le texte traduisible sont importés en tant qu'éléments inline traduisibles.

  • Éléments inline non traduisibles

    L'élément inline sélectionné nom, titre, para sera converti en balises et le contenu ne sera pas traduisible.

    Important

    Les problèmes avec les balises sont une cause fréquente d'erreurs d'exportation (par exemple, Le fichier n'a pas pu être généré), en particulier pour des types de fichiers tels que les tableurs (basés sur MS Excel) et .XML. Assurez-vous toujours que les balises et le formatage sont corrects avant d'exporter des fichiers en effectuant des vérifications d'assurance qualité.

  • Identifier automatiquement les éléments en ligne

    Les éléments qui sont voisins des nœuds de texte seront automatiquement convertis en balises en ligne.

  • Éléments (traités comme HTML)

    Le code de l'élément sélectionné est traité comme .HTML. Les paramètres d'importation .HTML tels que Préserver les espaces blancs ou La balise de saut (<br/>) crée un nouveau segment peuvent être utilisés pour ces éléments.

    Utilisez cette option lorsque la valeur de l'élément sélectionné contient du balisage .HTML. Cela ne s'applique pas aux enfants de l'élément sélectionné, sauf indication contraire.

  • Éléments verrouillés

    Les éléments sélectionnés seront importés en tant que Verrouillé.

  • Attributs verrouillés

    Les attributs sélectionnés seront importés en tant que Verrouillé.

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par des virgules) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés comme &quot;, le caractère Σ serait représenté comme &#x3A3; utilisez &quot;,&#x3A3;. & et < sont toujours exportés comme &amp; et &lt; respectivement.

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Lorsqu'un segment contient des éléments en ligne, l'analyse ICU pour ce segment est ignorée. Les segments sans éléments en ligne sont analysés normalement.

  • Importer les entités XML

    Les entités XML dans Déclaration DTD seront importées pour traduction.

  • Développer les entités générales personnalisées

  • Importer les commentaires

    Les commentaires ne sont pas importés si les éléments sont traités comme HTML, comme indiqué dans l'option Éléments (traités comme HTML).

  • Exclure les sous-éléments de la segmentation

    Sélectionnez pour empêcher la segmentation à l'intérieur des balises XML ou des sous-éléments. Ceci est utile si le XML contient des structures imbriquées où la segmentation briserait le sens logique du texte.

  • Créer un fichier d'aperçu XSLT

    Une feuille de style .XSL peut être téléchargée et un fichier d'aperçu lisible peut en être généré.

Paramètres XML utilisant XPath

L'utilisation du langage de requête XPath permet de créer des règles d'importation complexes et certaines fonctionnalités supplémentaires non disponibles dans les règles d'importation simples.

L'expression XPath doit définir les éléments et/ou attributs dont le texte/la valeur doit être traduit et non le nœud de texte réel.

Une familiarité avec XPath est recommandée avant utilisation.

Note de contexte, Clé de contexte, et Longueur cible max ne seront pas traités pour les fichiers contenant plus de 10 000 éléments XML.

  • Clé de contexte

    Constitue le contexte MT (correspondances 101 %) le cas échéant.

  • Note de contexte

    Importez des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importez des éléments ou la longueur max de la cible pour chaque élément. La limite de caractères pour chaque segment est affichée dans le volet Note de contexte à l’intérieur de l’éditeur. Tout caractère dépassant la limite est surligné en rouge.

  • Conserver les espaces blancs

    Laissez vide pour conserver les espaces blancs dans les éléments. Appliquez xml:whitespace='preserve'. //* pour conserver tous les espaces blancs dans tous les éléments, ou utilisez une expression XPath arbitraire.

  • Noeuds exclus de la segmentation

    Spécifiez les éléments ou attributs XML qui ne doivent pas être segmentés. Entrez une expression XPath qui identifie les nœuds à exclure. Tout texte extrait de ces nœuds sera conservé comme un seul segment plutôt que divisé en unités plus petites.

    Entrez //element[@attr='value'] pour exclure tous les <element> nœuds qui contiennent l'attribut attr="value" de la segmentation.

Aperçu HTML avec feuille de style XSLT

Le langage XSLT (Extensible Stylesheet Language Transformations) peut être utilisé pour transformer des documents .XML en format .HTML à des fins d'Aperçu en contexte. En conséquence, les fichiers d'aperçu téléchargés via Aperçu de la traduction dans le menu Document sont fournis avec l'extension HTML. Phrase prend actuellement en charge XSLT 2.0.

Le XSLT utilisé pour l'aperçu doit être basé sur la cible et non sur la source.

Cliquez sur Choisir un fichier pour importer une feuille de style.

Cliquez sur Télécharger XSLT pour télécharger la feuille de style après l'importation du fichier.

CDATA dans le fichier XML

CDATA signifie Données de Caractère et est défini comme des blocs de texte qui ne sont pas traités par le parseur mais sont reconnus comme balisage. Les entités prédéfinies telles que &lt;, &gt;, et &amp; nécessitent une saisie et sont généralement difficiles à lire dans le balisage. Dans de tels cas, la section CDATA peut être utilisée.

Si le CDATA contient du .HTML intégré, les éléments XML correspondants doivent être listés sous Éléments (traités comme HTML).

Si le fichier source contient du CDATA et que le Segment XML est utilisé, alors le CDATA est ajouté à chaque segment dans le fichier Complété.

Le CDATA ne sera segmenté que s'il y a une indication claire d'une rupture de segment telle que la ponctuation ou l'espacement.

Source:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Cible:

<text><![CDATA[Texte traduisible A.]]><![CDATA[ ]]><![CDATA[Texte traduisible B.]]></text>

Le fichier Complété est un .XML valide et le visualiseur XML affichera le texte correctement comme Texte traduisible A. Texte traduisible B.

Paramètres spécifiques à l'application

XML Wordpress

Paramètres recommandés pour XML Wordpress :

  • XML

    XPath

  • Éléments et attributs

    //*[local-name()='encoded']|//description|//title

  • Éléments (traités comme HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en balises Phrase

    (\[[^\]]++\])++

Sélectionnez Préserver les espaces blancs sous les paramètres HTML.

XML multilingue

Les fichiers multilingues sont importés en tant que plusieurs tâches bilingues avec des langues mappées avant l'importation. Ils sont représentés par multilingual_xml.png dans le tableau jobs. S'ils sont importés dans plusieurs langues cibles, le fichier Terminé est composé de toutes les langues cibles.

Phrase prend en charge les fichiers XML qui contiennent à la fois des éléments source et cible pour tous les paragraphes, même si la cible est vide. Lorsque la segmentation source et la segmentation cible sont différentes, la segmentation source est déterminante.

Les éléments de langue individuels doivent tous être des descendants du même élément trans-unit et une langue ne peut pas être contenue dans l'autre. Le contenu source et cible ne peut pas être stocké dans des valeurs d'attribut. Si plusieurs éléments correspondent à l'XPath pour la source ou la cible à l'intérieur de l'élément trans-unit, seul le premier est importé pour la traduction.

  • Lors de la création d'une tâche, sélectionnez XML multilingue dans le panneau Type de fichier avant d'appliquer les options d'importation. S'il n'est pas spécifié, le fichier sera importé en tant que .XML standard.

  • Le contenu des balises du fichier .XML source peut être visualisé dans l'éditeur en cliquant sur Développer les balises sous le menu Outil et édité en cliquant sur F2.

Exemple :

Exemple de texte partiellement traduit de l'anglais vers l'allemand et le français. Tous les <tuv lang="en">, <tuv lang="de"> et <tuv lang="fr"> sont des enfants du même élément <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texte non traduisible.
<tu note="note de contexte" clé="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Premier segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erstes segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="une autre note de contexte" key="Identifiant 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Deuxième segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Options d'importation

Pour l'importation de fichiers .XML multilingues, le langage de requête XPath doit être utilisé. Voir l'exemple ci-dessus pour référence. L'expression XPath définit les éléments dans lesquels le texte/la valeur doit être traduit et non le nœud de texte réel.

  • Éléments contenant des sous-éléments source et cible

    //tu

  • Éléments contenant du texte source

    tuv[@lang='en']/seg (en relation avec l'élément parent //tu)

  • Éléments inline non traduisibles

    Tous les éléments dans la source ou la cible sont considérés comme des éléments en ligne traduisibles, sauf spécification contraire ici comme éléments en ligne à ne pas traduire.

  • Clé de contexte

    Spécifiez une clé de contexte qui est enregistrée avec le segment dans la mémoire de traduction et utilisée pour le contexte de correspondance.

  • Note de contexte

    Importez des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importez des éléments ou la longueur max de la cible pour chaque élément

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par des virgules) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés comme &quot;, le caractère Σ serait représenté comme &#x3A3; utilisez &quot;,&#x3A3;. & et < sont toujours exportés comme &amp; et &lt; respectivement.

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Lorsqu'un segment contient des éléments en ligne, l'analyse ICU pour ce segment est ignorée. Les segments sans éléments en ligne sont analysés normalement.

  • Utiliser le sous-filtre HTML 

    Importe les balises HTML contenues dans le fichier. Les balises peuvent ensuite être utilisées avec les paramètres d'importation de fichiers HTML. Les balises de paragraphe <p> créeront de nouveaux segments même si Segmenter XML multilingue n'est pas sélectionné.

  • Utiliser le sous-filtre HTML

    Importe les balises HTML contenues dans le fichier. Les balises peuvent ensuite être utilisées avec les paramètres d'importation de fichiers HTML.

  • Segmenter XML multilingue

    Le texte est segmenté par une règle de segmentation générale plutôt qu'un segment par cellule.

    Caution

    L'application de Segment XML multilingue à un fichier contenant du texte cible peut entraîner un nombre de segments différent dans la source par rapport à la cible.

  • Définir le statut des segments non vides de la cible 

    Sélectionnez le statut de confirmation par défaut et si les segments confirmés sont ajoutés automatiquement à la MT.

  • Créer un fichier d'aperçu XSLT

    Une feuille de style .XSL peut être téléchargée et un fichier d'aperçu lisible peut en être généré.

Exemple :

Si un .XML multilingue contient un espace de noms, le XPath pourrait être le suivant :

  • Éléments contenant des sous-éléments source et cible

    //*[local-name()='trans-unit']

  • Éléments contenant du texte source

    *[local-name()='source']

  • Éléments contenant du texte cible

    *[local-name()='target']

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.