Paramètres d’importation de fichiers

.XML - Langage de balisage extensible (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Le format de fichier .XML n'est pas conçu pour la traduction et nécessite des paramètres supplémentaires pour une importation réussie.

Les paramètres par défaut sont marqués d'un astérisque (*) et importeront tous les éléments XML pour la traduction. Les options d'importation peuvent être utilisées pour modifier le comportement d'importation.

Types de fichiers

  • .XML

Options d'importation

Règles d'importation simples

  • Éléments

    Seuls les éléments sélectionnés (nom, titre, para) sont importés. Un astérisque (*) importe tous les éléments.

  • Attributs

    Seuls les attributs sélectionnés (nom, titre, para) sont importés. Un astérisque (*) importe tous les attributs.

  • Éléments internes traduisibles

    Si l'option Identifier automatiquement les éléments internes est sélectionnée, tous les éléments du texte traduisible sont importés comme éléments internes traduisibles.

  • Éléments internes non traduisibles

    Le nom, titre et para de l'élément interne sélectionné seront convertis en balises et le contenu ne sera pas traduisible.

  • Identifier automatiquement les éléments internes

    Les éléments voisins des nœuds de texte seront automatiquement convertis en balises internes.

  • Éléments (transformés en HTML)

    Le code de l'élément sélectionné est traité comme .HTML. . Les paramètres d'importation HTML tels que Conserver les espaces blancs ou les balises de saut (<br/>) créent de nouveaux segments peuvent être utilisés pour ces éléments.

  • Éléments verrouillés

    Les éléments sélectionnés seront importés comme verrouillés.

  • Attributs verrouillés

    Les attributs sélectionnés seront importés comme verrouillés.

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Les fichiers contenant des messages ICU ne peuvent contenir aucun élément interne.

  • Importer les entités XML

    Les entités XML de la Déclaration DTD seront importées pour traduction.

  • Segment XML

    Désélectionner si la segmentation n'est pas souhaitée.

  • Importer les commentaires

    Les commentaires ne sont pas importés si les éléments sont traités en HTML comme indiqué dans l'option Éléments (transformés en HTML).

  • Convertir en balises Phrase TMS 

    Appliquez des expressions régulières pour convertir le texte spécifié en balises.

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par une virgule) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés par ", le caractère Σ serait représenté par Σ utiliser ",Σ . & et < sont toujours exportés par & et < respectivement.

Paramètres XML utilisant XPath

L'utilisation du langage de requête XPath permet la création de règles d'importation complexes et de certaines fonctionnalités supplémentaires indisponibles dans les règles d'importation simples.

L'expression XPath doit définir les éléments et/ou attributs dont le texte/valeur doit être traduit et non le nœud de texte proprement dit.

Il est recommandé de se familiariser avec XPath avant de l'utiliser.

Note de contexte, Clé de contexte et longueur max. cible ne seront pas traitées pour les fichiers contenant plus de 10 000 éléments XML.

  • Clé de contexte

    Contexte de la MT (correspondances 101 %) le cas échéant.

  • Note de contexte

    Importer des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importer les éléments ou la longueur maximale de la cible pour chaque élément. La limite de caractères pour chaque segment est affichée dans le volet Note de contexte à l'intérieur de l'éditeur. Tout caractère dépassant la limite est surligné en rouge.

  • Préserver les espaces blancs

    Laissez vide pour conserver les espaces blancs dans les éléments. Appliquez xml:whitespace='preserve'. //* pour conserver tous les espaces blancs de tous les éléments, ou bien utilisez une expression XPath arbitraire.

Aperçu HTML avec feuille de style XSLT

Le langage XSLT (Extensible Stylesheet Language Transformations) peut être utilisé pour transformer des documents .XML en format .HTML à des fins d'aperçu en contexte. Par conséquent, les fichiers d’aperçu téléchargés via Aperçu de la traduction dans le menu Document sont livrés avec l’extension HTML. Phrase prend actuellement en charge XSLT 2.0.

Cliquez sur Choisir le fichier pour importer une feuille de style.

Cliquez sur Télécharger XSLT pour télécharger la feuille de style après l'importation du fichier.

CDATA dans un fichier XML

CDATA signifie Données de Caractère et est défini comme des blocs de texte qui ne sont pas traités par l'analyseur, mais qui sont reconnus comme balisage. Les entités prédéfinies telles que <, > et & nécessitent une saisie et sont généralement difficiles à lire dans le balisage. Dans de tels cas, la section CDATA peut être utilisée.

Si CDATA contient .HTML intégré, les éléments XML correspondants doivent être listés sous Éléments (transformés en HTML).

Si le fichier source contient CDATA et que le Segment XML est utilisé, CDATA est ajouté à chaque segment du fichier Terminé.

CDATA ne sera segmenté que s'il existe une indication claire d'une rupture de segment telle que la ponctuation ou l'espacement.

Source :

<text><![CDATA[Texte traduisible A. Texte traduisible B.]]></text>

Cible :

<text><![CDATA[Texte traduisible A.]]><![CDATA[ ]]><![CDATA[Texte traduisible B.]]></text>

Le fichier Terminé est valide .XML et la visionneuse XML affichera le texte correctement comme Texte traduisible A. Texte traduisible B.

Paramètres spécifiques à l'application

Wordpress XML

Paramètres recommandés pour Wordpress XML :

  • XML

    XPath

  • Éléments et attributs

    //*[local-name()='encoded']|//description|//title

  • Éléments (transformés en HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en balises Phrase

    (\[[^\]]++\])++

Sélectionnez Conserver les espaces sous les paramètres HTML.

XML multilingue

Les fichiers multilingues sont importés sous forme de plusieurs tâches bilingues avec des langues mappées avant l'importation. Elles sont représentées avec multilingual_xml.png dans la table des tâches. S'il est importé dans plusieurs langues cibles, le fichier Terminé est composé de toutes les langues cibles.

Phrase prend en charge les fichiers XML dont les éléments source et cible sont présents pour tous les paragraphes, même si la cible est vide. Lorsque la segmentation source et la segmentation cible sont différentes, la segmentation source est déterminante.

Les éléments linguistiques individuels doivent tous être descendants du même élément trans-unitaire et une langue ne peut pas être contenue dans l'autre. Le contenu source et cible ne peuvent pas être stockés dans des valeurs d'attribut. Si plusieurs éléments correspondent au XPath pour la source ou la cible à l'intérieur de l'élément trans-unit, seul le premier est importé pour traduction.

  • Lors de la création d'une tâche, sélectionnez XML multilingue dans le volet Type de fichier avant d'appliquer Options d'importation. Si ce n'est pas spécifié, le fichier sera importé comme .XML standard.

  • Le contenu des balises du fichier .XML source peut être visualisé dans l'éditeur en cliquant sur Développer les balises dans le menu Outil et modifié en cliquant sur F2.

Exemple :

Échantillon de texte partiellement traduit de l'anglais vers l'allemand et le français. Toutes les <tuv lang="fr">, <tuv lang="de"> et <tuv lang="fr"> sont des enfants du même <tu> élément.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texte non traduisible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Premier segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Segment Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Second segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Options d'importation

Pour l'importation de fichiers .XML multilingues, le langage de requête XPath doit être utilisé. Voir l'exemple ci-dessus pour référence. L'expression XPath définit les éléments dans lesquels le texte/valeur doit être traduit et non le nœud de texte proprement dit.

  • Éléments contenant des sous-éléments source et cible

    //tu

  • Éléments contenant le texte source

    tuv[@lang='en']/seg (par rapport à l'élément parent //tu)

  • Éléments contenant le texte cible

    tuv[@lang='de']/seg (par rapport à l'élément paNote de contexte rent //tu)

  • Éléments contenant le texte cible

    tuv[@lang='fr']/seg (par rapport à l'élément parent //tu)

  • Éléments internes non traduisibles

    Tous les éléments de la source ou de la cible sont considérés comme éléments internes traduisibles, à moins qu'ils ne soient spécifiés ici comme éléments internes non traduisibles.

  • Convertir en balises Phrase TMS 

    Appliquez des expressions régulières pour convertir le texte spécifié en balises.

  • Clé de contexte

    Spécifier une clé de contexte qui est enregistrée avec le segment dans la mémoire de traduction et utilisée pour le contexte de correspondance.

  • Note de contexte

    Importer des éléments ou des attributs de contexte pour chaque élément.

  • Longueur max. de la cible

    Importer les éléments ou la longueur maximale de la cible pour chaque élément

  • Convertir en entités de caractères

    Entrez une liste de références de caractères (séparées par une virgule) dans le fichier de sortie.

    Exemple :

    Si des guillemets (") sont requis, ils seraient représentés par ", le caractère Σ serait représenté par Σ utiliser ",Σ . & et < sont toujours exportés par & et < respectivement.

  • Analyser les messages ICU

    Les messages ICU sont automatiquement convertis en balises. Les fichiers contenant des messages ICU ne peuvent contenir aucun élément interne.

  • Utiliser le sous-filtre HTML 

    Importe les balises HTML contenues dans le fichier. Les balises peuvent ensuite être utilisées avec les paramètres d'importation de fichiers HTML. Les balises de paragraphe <p> créeront de nouveaux segments même si Segment Multilingual XML n’est pas sélectionné.

  • Segmenter XML multilingue

    Le texte est segmenté par une règle de segmentation générale plutôt que par un segment par cellule.

    Prudence

    L'application de XML multilingue segment à un fichier contenant du texte cible peut entraîner un nombre différent de segments dans la source que dans la cible.

  • Définir l'état du segment de la cible non vide 

    Sélectionnez l’état de confirmation par défaut et si les segments confirmés sont automatiquement ajoutés à la MT.

Exemple :

Si un .XML multilingue contient un espace de noms, le XPath peut être le suivant :

  • Éléments contenant des sous-éléments source et cible

    //*[local-name()='trans-unit']

  • Éléments contenant le texte source

    *[local-name()='source']

  • Éléments contenant le texte cible

    *[local-name()='target']

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.