La segmentazione è la suddivisione dei testi sorgente in parti più piccole. Questo migliora il recupero di testi precedentemente tradotti da una memoria di traduzione. I segmenti sono presentati nell'editor e possono essere filtrati. Se un progetto ha fasi di flusso di lavoro, le modifiche nei segmenti sono presentate nel pannello delle modifiche di traduzione.
Le regole di segmentazione predefinite corrispondono alle specifiche di ciascuna lingua supportata e possono essere personalizzate.
Lavori importati con una cattiva segmentazione, come file di documento mal formattati o l'applicazione di personalizzazioni di segmentazione inappropriate, possono influenzare i valori di corrispondenza TM. Si consiglia di dedicare del tempo alla revisione e alla preparazione del file sorgente prima dell'importazione; un problema comune è l'uso errato dei ritorni a capo rispetto ai ritorni a capo di paragrafo.
Esempio:
Buona segmentazione:
-
Le memorie di traduzione con lingue di destinazione multilingue sono supportate e possono essere utilizzate in modo bidirezionale.
Valore di corrispondenza del 100%.
Cattiva segmentazione
-
Le memorie di traduzione con lingue di destinazione multilingue sono supportate.
Valore di corrispondenza del 100%.
-
e possono essere utilizzate in modo bidirezionale.
Valore di corrispondenza del 63%.
Le regole di segmentazione personalizzate possono essere applicate a lavori e modelli di progetto. Se un progetto richiede una regola di segmentazione personalizzata, sarà necessario creare un modello per quel progetto. Quando impostate come primarie, le regole di segmentazione personalizzate vengono applicate a tutti i nuovi lavori importati per quella lingua sorgente.
Ci sono due tipi di regole di segmentazione:
-
Abbreviazioni per il file .XLSX
-
Espressione regolare dei file .SRX
Per usare regole personalizzate, scarica le regole predefinite, modificale, carica il file modificato e poi applicale ai lavori specificati.
Attenzione
Quando si aggiungono regole di segmentazione personalizzate per una lingua sorgente CJK senza spazi (mentre una lingua di destinazione utilizzerà spazi come delimitatore di parole), assicurati che vengano aggiunti spazi iniziali o finali ai segmenti di destinazione divisi dalla regola personalizzata; questo delimita le parole nella traduzione. Mentre questo avviene automaticamente nei segmenti formati dalle regole di segmentazione predefinite, non vengono aggiunti spazi nei segmenti divisi manualmente o in quelli formati da ulteriori regole di segmentazione personalizzate.
Per scaricare le regole di segmentazione predefinite, segui questi passaggi:
-
Dalla pagina Impostazioni
, scorri verso il basso fino alla sezione e fai clic su Segmentazione.
Si apre la pagina .
-
Seleziona la lingua da personalizzare e fai clic su Esporta XLSX/SRX.
Si apre la finestra .
-
Seleziona formato:
-
XLSX fornisce un elenco di abbreviazioni.
-
SRX fornisce regole di espressione regolare.
-
-
Seleziona una lingua dall'elenco a discesa.
-
Fai clic su Scarica.
Il file viene scaricato sul tuo sistema.
Per scaricare una regola di segmentazione precedentemente caricata che hai caricato in precedenza, segui questi passaggi:
-
Dalla pagina Impostazioni
, scorri verso il basso fino alla sezione e fai clic su Segmentazione.
Si apre la pagina .
-
Clicca sull'icona Impostazioni a destra e scegli Personalizza colonne:
-
Abilita la colonna Nome file
-
Clicca su un nome file per scaricare una regola pre-salvata.
Le abbreviazioni possono essere specificate per lingue individuali dopo le quali non dovrebbero essere creati nuovi segmenti.
Per modificare le abbreviazioni, segui questi passaggi:
-
Apri il file .XLSX scaricato in un editor.
-
Modifica i contenuti con il seguente formato:
Il file XLSX deve avere due colonne senza intestazioni.
-
Colonna 1: Abbreviazione da specificare
-
Colonna 2: Specificazione del comportamento di segmentazione
-
ABBR_UPPER_NUM
Un nuovo segmento non sarà creato se l'abbreviazione è seguita da uno spazio bianco e poi da un numero, un simbolo (matematica, segni di valuta, dingbats, ecc.) o una parola con la prima lettera maiuscola.
-
ABBR_NUM
Un nuovo segmento non sarà creato se l'abbreviazione è seguita da uno spazio bianco e poi da un numero.
-
-
-
Salva il file .XLSX modificato.
Modificare i file .SRX è un processo complesso adatto solo a utenti esperti nell'uso di espressioni regolari
Ci sono diverse regole che possono essere cambiate in un file SRX:
-
Importa testo da un file XLSX senza segmentazione; una cella è uguale a un segmento.
-
Importa il testo con una nuova riga per dividere un segmento in due.
-
Usa un due punti (o qualsiasi altro carattere) come separatore di segmento.
-
Vieta l'uso di un punto e virgola (o qualsiasi altro carattere) come separatore di segmento.
-
Rimuovendo un'abbreviazione dall'elenco (il testo sarà segmentato).
Queste regole sono basate su caratteri; solo un singolo carattere può essere usato come separatore di segmento. Gruppi di caratteri (ad esempio: <p>) non possono essere usati come separatore di segmento.
Per modificare un file SRX, segui questi passaggi:
-
Apri il file in un editor di testo come Notepad ++.
-
Modifica usando espressioni regolari o rimuovi completamente la segmentazione interna.
Esempio:
-
<rule break="no">L'elenco delle regole, dove il segmento non sarà spezzato. I.E. un elenco di abbreviazioni
-
<rule> <beforebreak>Un'espressione regolare per un carattere prima di una rottura (ad esempio, alla fine di una frase ". ? ! :"). Se, ad esempio, non vuoi segmentare il testo dopo un due punti, semplicemente elimina
:da ogni<rule><beforebreak>codice. -
<rule> <afterbreak>Un'espressione regolare per un carattere dopo una rottura (ad esempio, all'inizio di una nuova frase; uno spazio e una lettera maiuscola).
-
-
Salva il file SRX modificato.
Per caricare regole di segmentazione modificate o nuove, segui questi passaggi:
-
Dalla pagina Impostazioni
, scorri verso il basso fino alla sezione e clicca su Segmentazione.
Si apre la pagina .
-
Fai clic su Nuovo.
La pagina si apre.
-
Seleziona una dal menu a discesa.
-
Fornisci un per la regola.
-
Clicca su Scegli file.
Si apre una finestra di selezione file.
-
Seleziona il file delle regole modificate per il caricamento.
-
Controlla se le regole di segmentazione personalizzate saranno le regole di segmentazione primarie per la lingua selezionata.
-
Clicca su Crea.
La pagina si apre e la regola è stata aggiunta all'elenco.
Per utilizzare regole personalizzate su un'importazione di lavoro o configurare la lunghezza del segmento target, segui questi passaggi:
-
Al passaggio 8 di creazione di un lavoro, clicca su Segmentazione e lunghezza del segmento dalle .
Si apre il menu a discesa delle opzioni .
-
Seleziona le regole modificate dall'elenco a discesa .
-
Facoltativamente, configura un limite per la lunghezza del segmento target in base ai requisiti del progetto (ad es. traduzione di sottotitoli):
-
Seleziona e inserisci la percentuale preferita per limitare la lunghezza del segmento in base al segmento sorgente.
-
Seleziona e inserisci il conteggio dei caratteri per limitare la lunghezza del segmento in base al numero di caratteri.
-
-
Clicca su Crea.
Il lavoro è creato e aggiunto all'elenco utilizzando le regole di segmentazione specificate.
Rimuovi tutte le regole di segmentazione interne da un file SRX lasciando solo la segmentazione di base dell'intero paragrafo, elemento o cella applicata. Questa regola di segmentazione può essere applicata a ogni tipo di file (MS Word, XML, HTML, Excel, ecc.).
Esempio:
Questo esempio XLSX importato con segmentazione predefinita avrà 3 segmenti: Peter!, Aspetta!, e Ciao.
Se tutta la segmentazione interna viene rimossa lasciando solo la segmentazione di base basata sulla cella, allora ci sono solo due segmenti: Peter! Aspetta! e Ciao.
Modifica il file SRX per rimuovere tutte le regole di segmentazione predefinite, cioè il codice tra <!-- break rules --> e </languagerule>.
Esempio:
La cascata può causare il malfunzionamento di questo esempio. In tal caso, apri il file SRX modificato in Notepad++, trova i due attributi dell'elemento header e cambiali entrambi in no.