Paramètres d’importation de fichiers

.HTML (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Le contenu de la balise du fichier source peut être visualisé dans l'éditeur en cliquant sur Développer les balises sous le titre Balises dans le menu Modifier et modifié en cliquant sur F2.

Important

Les problèmes avec les balises sont une cause fréquente d'erreurs d'exportation. Assurez-vous toujours que les balises et le formatage sont corrects avant d'exporter les fichiers en effectuant des vérifications d'assurance qualité.

Tous les éléments ont au moins les attributs traduisibles suivants : titre, aria-label, aria-valuetext.

Les balises HTML non standard sont :

  • ignorées - des paragraphes séparés sont créés lorsque Convertir les balises non-HTML en balises Phrase est désactivé.

    • Balises HTML standard ignorées : base, basefont, canvas, colgroup, frameset, link, object, script, style

  • Importées en tant que balises en ligne uniques (non traduisibles) lorsque Convertir les balises non-HTML en balises Phrase est activé

Certains éléments ont plus d'attributs : <img> a alt, mais <a> n'en a pas car alt n'est pas un attribut standard pour <a>

Voir référence des éléments HTML pour les attributs standard et l'utilisation des entités HTML.

Types de fichiers

  • .HTML

  • .HTM

Options d'importation

  • La balise de rupture (<br/>) crée un nouveau segment

  • Convertir les balises non-HTML en balises Phrase

    Convertit les balises qui ne sont pas définies comme HTML. S'il y a des balises invalides, le système les ignore et analyse le reste.

    Exemples :

    <html> Test simple <unknown/>html.</html>

    Les balises non-HTML seront traitées comme des balises Phrase et importées en tant que Test simple {1}html.

    <html> Test simple <% unknown %>html.</html>

    La variable invalide (<% unknown %>) provoque une rupture de l'analyse. La partie cassée sera traitée comme à ne pas traduire et l'éditeur affichera Test simple, html.

  • Importer les commentaires

    Importe les commentaires autonomes en tant que balises. Les commentaires en ligne (dans les paragraphes) sont toujours importés en tant que balises.

  • Conserver les espaces blancs

    Conserve la même structure d'espaces blancs dans le document cible (par exemple, espacement, nouvelles lignes, etc.).

  • Mettre à jour la déclaration de langue dans les fichiers complétés

    Toutes les déclarations de langue dans les fichiers HTML complétés sont mises à jour avec un code de langue approprié.

  • Désactiver l'échappement des entités

    Désactive l'échappement des entités < et & dans les fichiers complétés.

  • Exclure les éléments

    Une liste de balises HTML séparées par des virgules qui ne doivent pas être importées pour traduction.

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Convertir les entités de caractères HTML en balises Phrase TMS

    Entrez une liste d'entités de caractères qui seront converties en balises lors de la traduction. Ceci est exporté vers le document traduit dans la même forme que celle présente dans le fichier source.

    Exemple :

    si &nbsp; est converti en une balise Phrase, la même entité (&nbsp;) sera préservée dans le document exporté.

  • Balises méta traduisibles

    • La détection automatisée n'est disponible que pour les balises <meta> avec l'attribut name="description" ou name="keywords" et attributes="property".

    • Utilisez une expression régulière pour spécifier les attributs dans les balises <meta> afin d'importer leur contenu. Par exemple, utilisez (?:pan-keywords) pour importer des balises méta avec l'attribut name="pan-keywords".

  • Attributs traduisibles

    Une liste de balises HTML séparées par des virgules qui indiquent les attributs traduisibles.

  • Éléments en ligne non traduisibles

    Une liste de balises HTML séparées par des virgules qui indiquent les éléments en ligne non traduisibles.

  • Éléments en ligne traduisibles

    Une liste de balises HTML séparées par des virgules qui indiquent les éléments en ligne traduisibles.

  • Espaces réservés de segmentation pour les balises HTML

    Personnalisez les caractères d'espace réservé internes utilisés par le sous-filtre HTML lors de la segmentation. Ces espaces réservés représentent les balises HTML ouvertes, fermées et simples en interne afin que les règles de segmentation SRX puissent les identifier.

    Les modifications n'affectent la segmentation que si les règles SRX font explicitement référence à ces caractères. Cela peut modifier l'exploitation de la mémoire de traduction (MT) pour les nouveaux imports.

    Formats d'entrée acceptés :

    • Point de code Unicode au format U+XXXX (par exemple, U+E7FD)

    • Caractère simple collé directement dans le champ (par exemple, ␢)

    Si l'un des trois champs est laissé vide, les valeurs par défaut de l'espace réservé correspondant sont utilisées :

    • Balise de début de segmentation espace réservé : U+E7FD

    • Balise de fermeture de segmentation espace réservé : U+E7FE

    • Balise unique de segmentation espace réservé : U+E7FF

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.