La segmentazione è la divisione dei testi di origine in parti più piccole. Ciò migliora il recupero del testo precedentemente tradotto da una memoria di traduzione. I segmenti vengono presentati nell'editor e possono essere filtrati.
Le regole di segmentazione predefinite corrispondono alle specifiche di ciascuna lingua supportata e possono essere personalizzate.
I lavori importati con segmentazione errata come file di documenti mal formattati o l’applicazione di una personalizzazione della segmentazione inappropriata possono influire sui valori di corrispondenza TM.
Esempio:
Buona segmentazione:
-
Sono supportate memorie di traduzione con lingue di destinazione multilingue che possono essere utilizzate in modo bidirezionale.
Valore corrispondenza 100%.
Scarsa segmentazione
-
Sono supportate memorie di traduzione con lingue di destinazione multilingue.
Valore corrispondenza 100%.
-
e può essere utilizzato in modo bidirezionale.
Valore corrispondenza del 63%.
Le regole di segmentazione personalizzate possono essere applicate a lavori e modelli di progetto. Se un progetto richiede una regola di segmentazione personalizzata, sarà necessario creare un modello per quel progetto. Se impostate come primarie, le regole di segmentazione personalizzate vengono applicate a tutti i nuovi lavori importati per quella lingua di origine.
Esistono due tipi di regole di segmentazione:
-
Abbreviazioni del file .XLSX
-
Espressione regolare dei file .SRX
Per usare regole personalizzate, scarica le regole predefinite, modificale, carica il file modificato e poi applicale a lavori specifici.
Cautela
Quando aggiungi regole di segmentazione personalizzate per una lingua di origine CJK senza spazi (mentre una lingua di destinazione utilizzerà spazi come delimitatore di parole), assicurati che gli spazi iniziali o finali vengano aggiunti ai segmenti di destinazione divisi dalla regola personalizzata; ciò delimita le parole nella traduzione. Sebbene ciò avvenga automaticamente nei segmenti formati dalle regole di segmentazione predefinite, non vengono aggiunti spazi nei segmenti divisi manualmente o in quelli formati da regole di segmentazione personalizzate aggiuntive.
Per scaricare le regole di segmentazione predefinite, segui i passaggi riportati di seguito:
-
Dalla pagina di Impostazioni, scorri verso il basso fino alla sezione Segmentazione.
e fai clic suSi apre la pagina
. -
Seleziona la lingua da personalizzare e fai clic su Esporta XLSX/SRX.
Si apre la finestra
. -
Seleziona formato:
-
XLSX fornisce un elenco di abbreviazioni.
-
SRX fornisce regole di espressione regolari.
-
-
Seleziona una lingua dall'elenco a discesa.
-
Fai clic su Scarica.
Il file viene scaricato nel sistema.
Per scaricare una regola di segmentazione caricata in precedenza, segui i passaggi riportati di seguito:
-
Dalla pagina di Impostazioni, scorri verso il basso fino alla sezione Segmentazione.
e fai clic suSi apre la pagina
. -
Fai clic sull'icona Impostazioni sulla destra e scegli Personalizza colonne:
-
Abilita la colonna Nome file
-
Fai clic su un nome di file per scaricare una regola pre-salvata.
È possibile specificare abbreviazioni per singole lingue dopo le quali non devono essere creati nuovi segmenti.
Per modificare le abbreviazioni, segui i passaggi riportati di seguito:
-
Apri il file .XLSX scaricato in un editor.
-
Modifica i contenuti con la seguente formattazione:
Il file XLSX deve avere due colonne senza intestazioni.
-
Colonna 1: Abbreviazione da specificare
-
Colonna 2: Specificazione del comportamento di segmentazione
-
ABBR_UPPER_NUM
Non viene creato un nuovo segmento se l'abbreviazione è seguita da uno spazio bianco e poi da un numero, un simbolo (matematica, segni di valuta, dingbat, ecc.) o una parola con la prima lettera maiuscola.
-
ABBR_NUM
Non verrà creato un nuovo segmento se l'abbreviazione è seguita dallo spazio bianco e poi da un numero.
-
-
-
Salvare il file .XLSX modificato.
La modifica dei file .SRX è un processo complesso adatto solo agli utenti esperti nell'utilizzo di espressioni regolari
Ci sono diverse regole che possono essere modificate in un file SRX:
-
Importa testo da un file XLSX senza segmentazione; una cella è uguale a un segmento.
-
importare il testo con una nuova riga ordine dividere un segmento in due.
-
Usa i due punti (o qualsiasi altro carattere) come separatore di segmento.
-
Proibisci di usare un punto e virgola (o qualsiasi altro carattere) come separatore di segmento.
-
Rimozione di un'abbreviazione dall'elenco (il testo verrà segmentato).
Queste regole sono basate su caratteri; può essere utilizzato solo un carattere come separatore di segmento. Non è possibile usare gruppi di caratteri (ad esempio: <p>) come separatore di segmento.
Per modificare un file SRX, segui i passaggi riportati di seguito:
-
Apri il file in un editor di testo come Notepad ++.
-
Modifica utilizzando espressioni regolari o rimuovi completamente la segmentazione interna.
Esempio:
-
<regola break="no">
L'elenco delle regole, in cui il segmento non verrà interrotto. Ad esempio un elenco di abbreviazioni
-
<rule> <beforebreak>
Un'espressione regolare per un carattere prima di un'interruzione (ad esempio, alla fine di una frase "? ! :"). Se, per esempio, non vuoi che il testo del segmento dopo i due punti, elimina
:
da ogni<regola><beforebreak>
codice. -
<regola> <afterbreak>
Un'espressione regolare per un carattere dopo un'interruzione (ad esempio, all'inizio di una nuova frase; uno spazio e una lettera maiuscola).
-
-
Salvare il file SRX modificato.
Per caricare regole di segmentazione modificate o nuove, segui i passaggi riportati di seguito:
-
Dalla pagina di Impostazioni, scorri verso il basso fino alla sezione Segmentazione.
e fai clic suSi apre la pagina
. -
Fai clic su Nuovo.
Si apre la pagina
di segmentazione SRX personalizzati. -
Seleziona una
dall'elenco a discesa. -
Fornisci un
alla regola. -
Fai clic su Scegli file.
Si apre una finestra di selezione dei file.
-
Seleziona il file di regole modificato per caricare.
-
Controlla
se le regole di segmentazione personalizzate saranno le regole di segmentazione primarie per la lingua selezionata. -
Fai clic su Crea.
Si apre la pagina
e la regola è stata aggiunta all'elenco.
Per usare regole personalizzate per importare un lavoro, segui i passaggi riportati di seguito:
-
Al passaggio 8 della creazione di un lavoro, fare clic su Segmentazione e Lunghezza segmento dalle .
Si apre il menu a discesa Opzioni di
segmento. -
Seleziona le regole modificate dall'elenco a discesa
. -
Fai clic su Crea.
Il lavoro viene creato e aggiunto all'elenco utilizzando le regole di segmentazione specificate.
Rimuovere tutte le regole di segmentazione interne da un file SRX lasciando applicata solo la segmentazione di base dell'intero paragrafo, elemento o cella. Questa regola di segmentazione può essere applicata a tutti i tipi di file (MS Word, XML, HTML, Excel, ecc.).
Esempio:
Questo esempio XLSX importato con segmentazione predefinita avrà 3 segmenti: Peter!, aspetta!, e Ciao.
Se tutta la segmentazione interna viene rimossa lasciando solo la segmentazione di base basata sulla cella, allora ci sono solo due segmenti: Peter! Aspetta! e Ciao.
Modifica il file SRX per rimuovere tutte le regole di segmentazione predefinite, ovvero il codice tra <!-- regole di interruzione -->
e </languagerule>
.
Esempio:
La cascata può causare il mancato lavoro di questo esempio. In tal caso, aprire il file SRX modificato in Notepad++, trovare i due attributi dell'elemento di intestazione
e modificarli entrambi in no
.