Gestion de projet

Segmentation Rules (TMS)

Le contenu est traduit de l’anglais par Phrase Language AI.

Segmentation

Segmentation est la division des textes source en parties plus petites. La récupération à partir d ' une mémoire de traduction est alors améliorée. Les segments peuvent être filtrés et présentés dans l'éditeur.

Les règles de segmentation par défaut correspondent aux spécificités de chaque langue supportée et peuvent être personnalisées.

Les tâches importées avec une mauvaise segmentation telles que des fichiers documents mal formatés ou l'application d'une personnalisation de segmentation inappropriée peuvent affecter les valeurs de correspondance MT.

Exemple :

Bonne segmentation :

  • Les mémoires de traduction avec des langues cibles multilingues sont prises en charge et peuvent être utilisées de manière bidirectionnelle.

    Correspondance de 100 %.

Mauvaise segmentation

  • Les mémoires de traduction avec des langues cibles multilingues sont prises en charge.

    Correspondance de 100 %.

  • et peut être utilisé de manière bidirectionnelle.

    Correspondance de 63 %.

Personnaliser les règles de segmentation

Des règles de segmentation personnalisées peuvent être appliquées aux tâches et modèles projet. Si un projet nécessite une règle de segmentation personnalisée, il faudra créer un modèle pour ce projet. Lorsqu'elles sont définies comme primaires, des règles de segmentation personnalisées sont appliquées à toutes les nouvelles tâches importées pour cette langue source.

Il existe deux types de règles de segmentation :

  • Abréviations du fichier .XLSX

  • Expression régulière des fichiers .SRX

Pour utiliser des règles personnalisées, téléchargez les règles par défaut, modifiez-les, chargez le fichier modifié, puis appliquez-les aux tâches spécifiées.

Caution

Lors de l'ajout de règles de segmentation personnalisées pour une langue source CJK sans Espace (alors qu'une langue cible utilisera des espaces comme délimiteur de mots), assurez-vous que des espaces de début ou de fin sont ajoutés aux segments cibles divisés par la règle personnalisée ; cela délimite les mots dans la traduction. Alors que cela se produit automatiquement dans les segments formés par les règles de segmentation par défaut, aucun espace n'est ajouté dans les segments divisés manuellement ou ceux formés par des règles de segmentation personnalisées supplémentaires.

Télécharger Default Segmentation Rules

Pour télécharger les règles de segmentation par défaut, procédez comme suit :

  1. Dans la page Setup_gear.png Paramètres, faites défiler vers le bas jusqu'à la section Paramètres projet et cliquez sur Segmentation .

    La page Segmentation s'ouvre.

  2. Sélectionnez la langue à personnaliser et cliquez sur Exporter XLSX/SRX.

    La fenêtre Exporter XLSX/SRX s'ouvre.

  3. Sélectionner le format :

    • XLSX fournit une liste d ' abréviations.

    • SRX fournit des règles d'expression régulière.

  4. Sélectionner une langue dans la liste déroulante.

  5. Télécharger :

    Le fichier est téléchargé dans votre système.

Pour télécharger une règle de segmentation précédemment téléversée, procédez comme suit :

  1. Dans la page Setup_gear.png Paramètres, faites défiler vers le bas jusqu'à la section Paramètres projet et cliquez sur Segmentation .

    La page Segmentation s'ouvre.

  2. Cliquez sur l'icône Paramètres à droite et choisissez Personnaliser les colonnes : customize-segmentation-columns.png

  3. Activer la colonne Nom de fichier

  4. Cliquez sur un nom de fichier pour télécharger une règle préenregistrée.

Modifier des abréviations dans un fichier .XLSX

Des abréviations peuvent être spécifiées pour chaque langue après laquelle de nouveaux segments ne doivent pas être créés.

Pour modifier les abréviations, procédez comme suit :

  1. Ouvrez dans un éditeur le fichier .XLSX téléchargé.

  2. Modifiez le contenu avec la mise en forme suivante :

    Le fichier XLSX doit comporter deux colonnes sans titres.

    • Colonne 1 : Abréviation à préciser

    • Colonne 2 : Spécification du comportement de segmentation

      • ABBR_UPPER_NUM

        Un nouveau segment n'est pas créé si l'abréviation est suivie d'Espaces blancs puis d'un nombre, d'un symbole (maths, signes monétaires, dingbats, etc.) ou d'un mot avec la première lettre en majuscule.

      • ABBR_NUM

        Un nouveau segment ne sera pas créé si l ' abréviation est suivie d ' un Espace blanc puis d ' un nombre.

  3. Enregistre le fichier .XLSX modifié.

Modifier expressions régulières dans un fichier .SRX

La modification de fichiers .SRX est un processus complexe adapté uniquement aux utilisateurs expérimentés dans l'utilisation des expressions régulières

Il existe plusieurs règles qui peuvent être modifiées dans un fichier SRX :

  • Importez sans segmentation le texte d'un fichier XLSX ; une cellule est égale à un segment .

  • Importez du texte avec une nouvelle ligne de commande pour diviser un segment en deux.

  • Utilisez deux points (ou tout autre caractère) comme séparateur de segments.

  • Interdire d'utiliser un point-virgule (ou tout autre caractère) comme séparateur de segments.

  • Retrait d'une abréviation de la liste (le texte sera segmenté).

Ces règles sont basées sur caractères; un seul caractère peut être utilisé comme séparateur de segments. Les groupes de caractères (par exemple : <p>) ne peuvent pas être utilisés comme séparateur de segments.

Pour modifier un fichier SRX, procédez comme suit :

  1. Ouvrir le fichier dans un éditeur de texte tel que le Bloc-notes ++.

  2. Modifiez avec des expressions régulières ou retirez complètement la segmentation interne.

    Exemple :

    BreakRules_Example.png
    • <rule break="no">

      La liste des règles, où le segment ne sera pas brisé. C’est-à-dire une liste d’abréviations

    • <rule> <beforebreak>

      Expression régulière pour un caractère avant un saut (par exemple, à la fin d'une phrase ". ? ! :"). Si vous, par exemple, ne voulez pas de texte segment après deux points, supprimez simplement : de chaque code <rule><beforebreak>.

    • <rule> <afterbreak>

      Expression régulière pour un caractère après une pause (par exemple, au début d'une nouvelle phrase; un Espace et une lettre majuscule).

  3. Enregistre le fichier SRX modifié.

Charger nouvelles règles de segmentation

Pour charger des règles de segmentation modifiées ou nouvelles, procédez comme suit :

  1. À partir de la page Setup_gear.png paramètres, faites défiler vers le bas jusqu'à la section Paramètres projet et cliquez sur Segmentation .

    La page Segmentation s'ouvre.

  2. Cliquez sur Nouveau.

    La page Charger un fichier de segmentation personnalisé XLSX ou SRX s ' ouvre.

  3. Sélectionner une Langue dans la liste déroulante.

  4. Fournis un Nom pour la règle.

  5. Cliquez sur Choisir le fichier.

    Une fenêtre de sélection de fichiers s'ouvre.

  6. Sélectionner le fichier de règles à charger modifié.

  7. Cochez Primary si les règles de segmentation personnalisées seront les règles de segmentation primaires pour la langue sélectionnée.

  8. Cliquez sur Créer.

    La page Segmentation s'ouvre et la règle a été ajoutée à la liste.

Utiliser règles de segmentation personnalisées sur tâche Importer

Pour utiliser des règles personnalisées sur une tâche importer, procédez comme suit:

  1. À l'étape 8 de la création d'une tâche, cliquez sur Segmentation et longueur des paramètres Importer fichier .

    La liste déroulante des options Segmentation et longueur s'ouvre.

  2. Sélectionner les règles modifiées dans la liste déroulante Segmentation source rules .

  3. Cliquez sur Créer.

    La tâche est créée et ajoutée à la liste selon les règles de segmentation spécifiées.

Exemple de segmentation modifiée (1 segment cellule 1)

Retirer toutes les règles de segmentation interne d ' un fichier SRX en ne laissant que la segmentation de base de l ' ensemble du paragraphe, de l ' élément ou de la cellule appliqué. Cette règle de segmentation peut être appliquée à tous les types de fichiers (MS Word, XML, HTML, Excel, etc.).

Exemple :

A

B

1

Peter ! Attendez !

2

Bonjour.

3

Cet exemple XLSX importé avec segmentation par défaut aura 3 segments : Peter !, Attends !, et Bonjour.

Si toute segmentation interne est supprimée ne laissant que la segmentation de base basée sur la Cellule, alors il n'y a que deux segments : Peter ! Attends ! et Bonjour.

Modifiez le fichier SRX pour retirer toutes les règles de segmentation par défaut, c'est-à-dire le code entre <!-- break rules --> et </languagerule>.

Exemple :

1cell-1segment-srx.png

Une cascade peut entraîner le non travail de cet exemple. Dans un tel cas, ouvrez le fichier SRX modifié dans Notepad++, trouvez les deux attributs de l'élément d'en-tête et modifiez les deux par non.

Cet article vous a-t-il été utile ?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.