Évaluations automatisées

Le contenu est traduit de l’anglais par Phrase Language AI.

Des évaluations automatisées sont fournies pour chaque modèle de TA. Cliquer sur un nom de modèle ou sur les points de suspension dans la colonne Plus pour les afficher.

Phrase Custom AI offre des données riches et un support visuel avancé conçu pour fournir une compréhension plus approfondie de la qualité du modèle NextMT Personnalisé :

L'onglet Vue d'ensemble fournit un résumé des résultats d'évaluation, présentant des visualisations intuitives et des métadonnées sur le modèle de TA.
- Le tableau Comparaison des performances compare les performances des modèles NextMT génériques par rapport aux modèles NextMT Personnalisé à travers quatre métriques de qualité de TA. Le tableau comporte deux sections principales :
  - Performance de référence
    
    Affiche les scores de qualité de TA automatisés pour Phrase NextMT et un modèle NextMT Personnalisé sans levier MT.
  - Performance RAG
    
    Affiche les scores de qualité de TA automatisés où les correspondances approximatives de MT sont exploitées pour adapter la sortie de TA.
  La colonne Meilleur moteur met en évidence le modèle le plus performant pour chaque métrique.
- Le panneau Métadonnées du modèle fournit des informations essentielles sur le modèle NextMT Personnalisé évalué.
L'onglet Visualisations fournit une représentation graphique des résultats d'évaluation de TA via des graphiques en anneau, offrant une répartition des segments de traduction évalués par catégorie de qualité.
- Sélectionner la métrique de qualité de TA souhaitée dans le menu déroulant en haut pour comparer le modèle NextMT Personnalisé par rapport au modèle NextMT Phrase générique.
- Survoler chaque catégorie du ou des graphiques en anneau pour afficher le pourcentage et le nombre de segments affectés pour cette catégorie.
L'onglet Échantillon d'évaluation présente un aperçu d'un échantillon de segment provenant de l'ensemble d'évaluation, affichant une liste de segments source avec les scores de performance de référence et RAG pertinents.

Lorsqu'un segment est sélectionné, le panneau de droite affiche :
- Les scores spécifiques au segment et les indicateurs de niveau de qualité pour la performance de référence et RAG.
- Une comparaison de la sortie de traduction générée par les modèles NextMT Personnalisé et générique par rapport à la traduction de référence du jeu de données. Sélectionnez Afficher les différences dans la sortie du moteur pour mettre en surbrillance les différences par rapport à la traduction de référence.