Le format de fichier .XML n'est pas conçu pour la traduction et nécessite des paramètres supplémentaires pour importer correctement.
Les paramètres par défaut sont marqués d'un astérisque (*) et importeront tous les éléments XML pour traduction. Les options Importer peuvent être utilisées pour modifier le comportement d'importer.
Les chatbots IA peuvent être très efficaces pour identifier les problèmes de format dans les fichiers basés sur .XML.
Types de fichiers
-
.XML
Options d'importation
Règles d'importation simples
-
Seuls les éléments sélectionnés (nom, titre, para) sont importés. Un astérisque ( ) importe tous les éléments.
-
Seuls les attributs sélectionnés (nom, titre, para) sont importés. Un astérisque ( ) importe tous les attributs.
-
Si l'option internes traduisibles.
internes est sélectionnée, tous les éléments du texte traduisible sont importés en tant qu'éléments -
L'élément inline sélectionné name, title, para sera converti en balises et le contenu ne sera pas traduisible.
-
Les éléments voisins des nœuds de texte seront automatiquement convertis en balises internes.
-
Le code de l'élément sélectionné est traité comme .HTML. .HTML importe paramètres tels que Conserver les espaces blancs ou balise break (<br/>) crée de nouveaux segments peuvent être utilisés pour ces éléments.
Utiliser cette option lorsque la valeur de l'élément sélectionné contient un balisage .HTML. Elle ne s'applique pas aux enfants de l'élément sélectionné, sauf indication contraire.
-
Les éléments sélectionnés seront importés comme verrouillés .
-
Les attributs sélectionnés seront importés comme verrouillés .
-
Les messages ICU sont automatiquement convertis en balises. Les fichiers contenant des messages ICU ne peuvent contenir aucun élément inline.
-
Les entités XML dans la déclaration DTD seront importées pour traduction.
-
Désélectionner si segmentation non souhaitée.
-
Les commentaires ne sont pas importés si les éléments sont traités comme HTML comme indiqué dans l'option Éléments (transformés en HTML).
-
Appliquez des expressions régulières pour convertir le texte spécifié en balises.
-
Entrez une liste de références de caractères (séparées par une virgule) dans le fichier de sortie.
Exemple :
Paramètres XML avec XPath
L'utilisation de la langue de requête XPath permet de créer des règles d'importation complexes et certaines fonctionnalités supplémentaires indisponibles dans les règles d'importation simples.
L'expression XPath doit définir les éléments et/ou attributs dont le texte/valeur doit être traduit et non le nœud de texte proprement dit.
Il est recommandé de se familiariser avec XPath avant de l’utiliser.
, et ne seront pas traitées pour les fichiers contenant plus de 10 000 éléments XML.
-
Constitue le contexte MT (correspondances 101 %) le cas échéant.
-
Importer des éléments ou des attributs de contexte pour chaque élément.
-
Importer des éléments ou la longueur cible maximale pour chaque élément. La limite de caractères pour chaque segment est affichée dans le volet de l’éditeur. Tout caractère dépassant la limite est surligné en rouge.
-
Laisser vide pour conserver les espaces blancs dans les éléments. Appliquez xml:whitespace='preserve'. //* pour conserver tous les espaces blancs dans tous les éléments, ou utilisez une expression XPath arbitraire.
Aperçu HTML avec feuille de style XSLT
langue XSLT (Extensible Stylesheet Language Transformations) peut être utilisée pour transformer des documents .XML au format .HTML à des fins d'aperçu en contexte. Par conséquent, les fichiers aperçu téléchargés via la traduction aperçu dans le menu Document sont dotés d ' une extension HTML. Phrase prend actuellement en charge XSLT 2.0.
Cliquer sur Choisir un fichier pour importer une feuille de style.
Clique sur Télécharger XSLT pour télécharger la feuille de style après importation fichier.
CDATA dans un fichier XML
CDATA signifie Données caractères et est défini comme des blocs de texte qui ne sont pas traités par l'analyseur, mais qui sont reconnus comme balisage. Les entités prédéfinies telles que <,
>
et &
nécessitent une saisie et sont généralement difficiles à lire dans le balisage. Dans ce cas, la section CDATA peut être utilisée.
Si CDATA contient un .HTML intégré, les éléments XML correspondants doivent être listés sous
.Si le fichier source contient CDATA et que le
est utilisé, CDATA est ajouté à chaque segment du fichier Terminé.Le CDATA ne sera segmenté que s'il existe une indication effacée d'un saut de segment tel qu'une ponctuation ou un espacement.
Source :
<text><![CDATA[Texte traduisible A. Texte traduisible B.]]></text>
Cible :
<text><![CDATA[Texte traduisible A.]]><![CDATA[ ]]><![CDATA[Texte traduisible B.]]></text>
Le fichier Terminé est .XML valide et la visionneuse XML affichera le texte correctement sous forme de texte Traduisible A. Texte Traduisible B.
Les fichiers multilingues sont importés sous forme de tâches bilingues multiples dont les langues sont mappées avant importation. Elles sont représentées avec dans la table des tâches. S'il est importé dans plusieurs langues cibles, le fichier Terminé est composé de toutes les langues cibles.
Phrase prend en charge les fichiers XML dont les éléments source et cible sont présents pour tous les paragraphes même si la cible est vide. Lorsque les segmentations source et cible sont différentes, la segmentation source est déterminante.
Les éléments de langue individuels doivent tous être les descendants du même élément trans-unité et une langue ne peut pas être contenue dans l'autre. Le contenu source et cible ne peut pas être stocké dans des valeurs d'attribut. Si plusieurs éléments correspondance au XPath pour la source ou la cible à l'intérieur de l'élément trans-unit, seul le premier est importé pour traduction.
-
Lors de la création d'une tâche, sélectionnez dans le volet avant d'appliquer les Options d'importation. Si non spécifié, le fichier sera importé comme .XML standard.
-
Contenu balise du fichier .XML source peut être visualisé dans l'éditeur en cliquant sur Développer les balises sous le menu et modifié en cliquant sur F2.
Exemple :
Échantillon de texte partiellement traduit de l'anglais vers l'allemand et le français. Toutes les <tuv lang="en">
, <tuv lang="de">
et <tuv lang="fr">
sont des enfants du même <tu>
élément.
<?xml version="1.0" encoding="utf-8"?> <root> Texte non traduisible <tu note="note de contexte" clé="Identifiant 254" maxlen="16"> <tuv lang="en"> <seg>Premier segment.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="une autre note de contexte" clé="Identifiant 255" maxlen="18"> <tuv lang="en"> <seg>Second segment.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Options d'importation
Pour importer des fichiers .XML multilingues, la langue de requête XPath doit être utilisée. Voir pour référence l'exemple ci-dessus. L'expression XPath définit les éléments dans lesquels le texte/valeur doit être traduit et non le nœud de texte proprement dit.
-
//tu
-
tuv[@lang='en']/seg
(par rapport à l'élément parent//tu
) -
tuv[@lang='de']/seg
(par rapport à l'élément de loyer pa//tu
) -
tuv[@lang='fr']/seg
(par rapport à l'élément parent//tu
) -
Tous les éléments source ou cible sont considérés comme des éléments internes traduisibles, à moins qu'ils ne soient spécifiés ici comme des éléments internes à ne pas traduire.
-
Appliquez des expressions régulières pour convertir le texte spécifié en balises.
-
Spécifier une clé de contexte qui est enregistrée avec le segment dans la mémoire de traduction et utilisée pour le contexte de correspondance.
-
Importer des éléments ou des attributs de contexte pour chaque élément.
-
Importer des éléments ou la longueur cible maximale pour chaque élément
-
Entrez une liste de références de caractères (séparées par une virgule) dans le fichier de sortie.
Exemple :
-
Les messages ICU sont automatiquement convertis en balises. Les fichiers contenant des messages ICU ne peuvent contenir aucun élément inline.
-
Importe les balises HTML contenues dans le fichier. Les balises peuvent ensuite être utilisées avec paramètres Importer fichier HTML. Les balises de paragraphe
<p>
créeront de nouveaux segments même si n’est pas sélectionné. -
Le texte est segmenté par une règle de segmentation générale plutôt qu'un segment par cellule.
Prudence
L’application
à un fichier qui contient du texte cible peut entraîner un nombre de segments dans la source et dans la cible différent. -
Sélectionner le statut de confirmation par défaut et déterminer si les segments confirmés sont automatiquement ajoutés à MT.
Exemple :