Paramètres d’importation de fichiers

.HTML (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Le contenu de la balise du fichier source peut être visualisé dans l'éditeur en cliquant sur Développer les balises sous le titre Balises dans le menu Modifier et modifié en cliquant sur F2.

Important

Les problèmes avec les balises sont une cause courante d'erreurs d'exportation. Assurez-vous toujours que les balises et le formatage sont corrects avant d'exporter des fichiers en effectuant des vérifications d'assurance qualité.

Tous les éléments ont au moins les attributs traduisibles suivants : titre, aria-label, aria-valuetext.

Les balises HTML non standard sont :

  • ignorées - des paragraphes séparés sont créés lorsque Convertir les balises non-HTML en balises Phrase est défini sur faux.

    • Balises HTML standard ignorées : base, basefont, canvas, colgroup, frameset, link, object, script, style

  • Importé en tant que balises en ligne uniques (non traduisibles) lorsque Convertir les balises non-HTML en balises Phrase est vrai

Certains éléments ont plus d'attributs : <img> a alt, mais <a> n'en a pas car alt n'est pas un attribut standard pour <a>

Voir référence des éléments HTML pour les attributs standard et l'utilisation des entités HTML.

Types de fichiers

  • .HTML

  • .HTM

Options d'importation

  • Les balises de saut (<br/>) créent de nouveaux segments

  • Convertir les balises non HTML en balises Phrase

    Convertit les balises qui ne sont pas définies comme HTML. S'il y a des balises invalides, le système les ignore et analyse le reste.

    Exemples :

    <html> Test simple <unknown/>html.</html>

    Les balises non-HTML seront traitées comme des balises Phrase et importées comme Test simple {1}html.

    <html> Test simple <% unknown %>html.</html>

    La variable invalide (<% unknown %>) provoque une rupture de l'analyse. La partie cassée sera traitée comme non traduisible et l'éditeur affichera Test simple, html.

  • Importer les commentaires

    Importe des commentaires autonomes en tant que balises. Les commentaires en ligne (dans les paragraphes) sont toujours importés en tant que balises.

  • Conserver les espaces blancs

    Préserve la même structure d'espacement dans le document cible (par exemple, espaces, nouvelles lignes, etc.).

  • Mettre à jour la déclaration de langue dans les fichiers terminés

    Toutes les déclarations de langue dans les fichiers HTML complétés sont mises à jour avec un code de langue approprié.

  • Désactiver l’échappement des entités

    Désactive l'échappement des entités < et & dans les fichiers complétés.

  • Exclure les éléments

    Une liste de balises HTML séparées par des virgules qui ne doivent pas être importées pour traduction.

  • Convertir en balises Phrase TMS 

    Appliquer des expressions régulières pour convertir en balises certains textes.

  • Convertir les entités de caractères HTML en balises Phrase TMS

    Entrez une liste d'entités de caractères qui seront converties en balises lors de la traduction. Celles-ci sont exportées vers le document traduit sous la même forme qu'elles sont présentes dans le fichier source.

    Exemple :

    si &nbsp; est converti en une balise Phrase, la même entité (&nbsp;) sera préservée dans le document exporté.

  • Méta-balises traduisibles

    • La détection automatisée est disponible uniquement pour les balises <meta> avec l'attribut name="description" ou name="keywords" et attributes="property".

    • Utilisez une expression régulière pour spécifier les attributs dans les balises <meta> pour importer leur contenu. À titre d'exemple, utilisez (?:pan-keywords) pour importer des balises meta avec l'attribut name="pan-keywords".

  • Attributs traduisibles

    Une liste de balises HTML séparées par des virgules qui indiquent des attributs traduisibles.

  • Éléments internes à ne pas traduire

    Une liste de balises HTML séparées par des virgules qui indiquent des éléments en ligne non traduisibles.

  • Éléments inline traduisibles

    Une liste de balises HTML séparées par des virgules qui indiquent des éléments en ligne traduisibles.

  • Espaces réservés de segmentation pour les balises HTML

    Personnalisez les caractères d'espace réservé internes utilisés par le sous-filtre HTML lors de la segmentation. Ces espaces réservés représentent des balises HTML ouvertes, fermées et simples en interne afin que les règles de segmentation SRX puissent les identifier.

    Les changements n'affectent la segmentation que si les règles SRX font explicitement référence à ces caractères. Cela peut modifier l'exploitation de la mémoire de traduction (MT) pour les nouvelles importations.

    Formats d'entrée acceptés:

    • Point de code Unicode au format U+XXXX (par exemple, U+E7FD)

    • Caractère simple collé directement dans le champ (par exemple, ␢)

    Si l'un des trois champs est laissé vide, les valeurs par défaut de l'espace réservé correspondant sont utilisées :

    • Balise de début de segmentation espace réservé : U+E7FD

    • Balise de fermeture de segmentation espace réservé : U+E7FE

    • Balise unique de segmentation espace réservé : U+E7FF

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.