Il formato file XML non è progettato per la traduzione e richiede impostazioni aggiuntive per importare correttamente.
Le impostazioni predefinite sono contrassegnate con un asterisco (*) e importeranno tutti gli elementi XML per la traduzione. Le opzioni di importazione possono essere utilizzate per modificare il comportamento di importazione.
I chatbot IA possono essere molto efficaci nell'identificare i problemi di formato nei file basati su XML.
Tipi di file
-
.XML
Importa opzioni
Regole per importare normali
-
Vengono importati solo gli elementi selezionati (es. nome, titolo, paragrafo). Un asterisco ( ) importa tutti gli elementi.
-
Vengono importati solo gli attributi selezionati (es. nome, titolo, paragrafo). Un asterisco ( ) importa tutti gli attributi.
-
Se l'opzione inline traducibili.
è selezionata, tutti gli elementi nel testo traducibile vengono importati come elementi -
Nome, titolo, para dell'elemento inline selezionato saranno convertiti in tags e il contenuto non sarà traducibile.
Importante
I problemi relativi ai tags sono una causa comune di errori di esportazione, soprattutto per tipi di file come i fogli di calcolo (basati su MS Excel) e i file XML. Assicurati sempre che tags e formattazione siano corretti prima di esportare i file eseguendo controlli di quality assurance.
-
Gli elementi vicini ai nodi di testo verranno automaticamente convertiti in tags in linea.
-
Il codice dell’elemento selezionato viene elaborato come .HTML. È possibile importare impostazioni .HTML come Conserva spazi o Break tag (<br/>) per creare un nuovo segmento per questi elementi.
Usa questa opzione quando il valore dell’elemento selezionato contiene un markup .HTML. Non si applica ai figli dell'elemento selezionato, se non diversamente specificato.
-
Gli elementi selezionati saranno importati come Bloccati.
-
Gli attributi selezionati saranno importati come Bloccati.
-
I messaggi ICU vengono automaticamente convertiti in tag. I file con messaggi ICU non possono contenere elementi in linea.
-
Le entità XML nella dichiarazione DTD saranno importate per la traduzione.
-
Deseleziona se la segmentazione non è desiderata.
-
I commenti non vengono importati se gli elementi vengono elaborati come HTML come indicato nell'opzione Elementi (elaborati come HTML).
-
Applica espressioni regolari per convertire il testo specificato in tag.
-
Immettere un elenco di riferimenti di caratteri (separati da virgole) nel file di output.
Esempio:
Impostazioni XML utilizzando XPath
L'utilizzo della lingua di query XPath consente la creazione di regole di importazione complesse e di alcune funzionalità aggiuntive non disponibili nelle regole di importazione normali.
L'espressione XPath dovrebbe definire gli elementi e/o attributi il cui testo/valore dovrebbe essere tradotto e non il nodo di testo vero e proprio.
Prima di utilizzare XPath, si consiglia di familiarizzarsi con esso.
, e non verranno elaborate per i file con oltre 10.000 elementi XML.
-
Costituisce contesto TM (corrispondenze 101%) se applicabile.
-
Importa elementi o attributi di contesto per ogni elemento.
-
Importa elementi o la lunghezza massima di destinazione per ogni elemento. Il limite di caratteri per ogni segmento viene visualizzato nel pannello all’interno dell’editor. Tutti i caratteri che provocano il superamento del limite sono evidenziati in rosso.
-
Mantieni empty per conservare gli spazi negli elementi. Applica xml:whitespace='preserve'. //* per conservare tutti gli spazi in tutti gli elementi o usa un'espressione XPath arbitraria.
Anteprima HTML con foglio di stile XSLT
La lingua XSLT (Extensible Stylesheet Language Transformations) può essere utilizzata per trasformare documenti XML in formato .HTML a fini di anteprima contestuale. Di conseguenza, i file di anteprima scaricati tramite la traduzione anteprima nel menu Documento sono dotati di estensione HTML. Phrase attualmente supporta XSLT 2.0.
Fai clic su Scegli file per importare un foglio di stile.
Fai clic su Scarica XSLT per scaricare il foglio di stile dopo aver importato il file.
CDATA in file XML
CDATA significa dati carattere ed è definito come blocchi di testo che non vengono elaborati dall'analizzatore ma vengono riconosciuti come markup. Entità predefinite come <,
>
e &
richiedono la digitazione e sono generalmente difficili da leggere nel markup. In questi casi, può essere utilizzata la sezione CDATA.
Se CDATA contiene .HTML incorporato, gli elementi XML corrispondenti devono essere elencati in
.Se il file di origine contiene CDATA e viene utilizzato il
, CDATA viene aggiunta a tutti i segmenti nel file completato.CDATA verrà segmentata solo se viene cancellata un’interruzione di segmento come punteggiatura o spaziatura.
Origine:
<text><![CDATA[Testo traducibile A. Testo traducibile B.]></text>
Target:
<text><![CDATA[Testo traducibile A.]]><![CDATA[ ]]><![CDATA[Testo traducibile B.]></text>
Il file completato è .XML valido e il visualizzatore XML mostrerà correttamente il testo come testo traducibile A. Testo traducibile B.
I file multilingue vengono importati come lavori bilingui multipli con le lingue mappate prima dell'importazione. Essi sono rappresentati con nella tabella dei lavori. Se importato in diverse lingue di destinazione, il file Completato è composto da tutte le lingue di destinazione.
Phrase supporta file XML che hanno elementi di origine e destinazione presenti per tutti i paragrafi anche se la destinazione è empty. Quando la segmentazione origine e destinazione sono diverse, la segmentazione origine è determinante.
I singoli elementi lingua devono essere tutti discendenti dello stesso elemento trans-unità e una lingua non può essere contenuta nell’altra. Contenuto di origine e destinazione non possono essere memorizzati nei valori degli attributi. Se più elementi corrispondenza all’XPath per origine o destinazione all’interno dell’elemento trans-unità, solo il primo viene importato per la traduzione.
-
Quando si crea un lavoro, selezionare dal pannello prima di applicare le opzioni Importa. Se non specificato, il file verrà importato come .XML standard.
-
Il contenuto dei tag del file XML di origine può essere visualizzato nell'editor facendo clic su Espandi tags nel menu e modificato facendo clic su F2.
Esempio:
Esempio di testo parzialmente tradotto dall'inglese al tedesco e al francese. Tutti <tuv lang="en">
, <tuv lang="de">
e <tuv lang="fr">
sono figli dello stesso <tu>
elemento.
<?xml version="1.0" encoding="utf-8"?> <root> Testo non traducibile. <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>Primo segmento.</seg> </tuv> <tuv lang="de"> <seg>Erste segmento</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="un'altra nota di contesto" chiave="ID 255" maxlen="18"> <tuv lang="en"> <seg>Secondo segmento.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Importa opzioni
Per importare file XML multilingue deve essere utilizzata la lingua di query XPath. Vedi l'esempio sopra per riferimento. L'espressione XPath definisce gli elementi in cui il testo/valore deve essere tradotto e non il nodo di testo vero e proprio.
-
//tu
-
tuv[@lang='en']/seg
(in relazione all'elemento dell'entità principale//tu
) -
tuv[@lang='de']/seg
(in relazione all'elemento paNota rent//tu
) -
tuv[@lang='fr']/seg
(in relazione all'elemento dell'entità principale//tu
) -
Tutti gli elementi nell'origine o destinazione sono considerati elementi in linea traducibili a meno che non siano qui specificati come elementi in linea non traducibili.
-
Applica espressioni regolari per convertire il testo specificato in tag.
-
Specifica una chiave di contesto che viene salvata con il segmento nella memoria di traduzione e usata per il contesto di corrispondenza.
-
Importa elementi o attributi di contesto per ogni elemento.
-
Importa elementi o la lunghezza massima di destinazione per ogni elemento
-
Immettere un elenco di riferimenti di caratteri (separati da virgole) nel file di output.
Esempio:
-
I messaggi ICU vengono automaticamente convertiti in tag. I file con messaggi ICU non possono contenere elementi in linea.
-
Importa tag HTML contenuti nel file. I tags possono quindi essere utilizzati con le impostazioni di importazione dei file .HTML. I tag di paragrafo
<p>
creeranno nuovi segmenti anche se l’opzione non è selezionata. -
Il testo è segmentato da una regola di segmentazione generale piuttosto che da un segmento per cella.
Cautela
L’applicazione del
a un file che contiene testo di destinazione può comportare un numero diverso di segmenti nell’origine rispetto alla destinazione. -
Seleziona lo stato predefinito di conferma e se i segmenti confermati vengono aggiunti automaticamente alla TM.
Esempio: