El formato de archivo .XML no está diseñado para la traducción y requiere configuraciones adicionales para una importación exitosa.
Las configuraciones predeterminadas están marcadas con un asterisco (*) e importarán todos los elementos XML para traducción. Las opciones de importación se pueden usar para cambiar el comportamiento de importación.
Los servicios de IA pueden ser muy efectivos para identificar problemas de formato en archivos basados en .XML.
Tipos de archivo
-
.XML
Opciones de importación
Reglas de importación simples
-
Solo se importan los elementos seleccionados (es decir, nombre, título, párrafo). Un asterisco ( ) importa todos los elementos.
-
Solo se importan los atributos seleccionados (es decir, nombre, título, párrafo). Un asterisco ( ) importa todos los atributos.
-
Si la opción Traducibles en línea.
está seleccionada, todos los elementos en el texto traducible se importan como elementos -
El elemento en línea seleccionado nombre, título, párrafo se convertirá en etiquetas y el contenido no será traducible.
Importante
Los problemas con etiquetas son una causa común de errores de exportación (por ejemplo, ), especialmente para tipos de archivos como hojas de cálculo (basados en MS Excel) y .XML. Siempre asegúrese de que las etiquetas y el formato sean correctos antes de exportar archivos ejecutando verificaciones de control de calidad.
-
Los elementos que son vecinos de nodos de texto se convertirán automáticamente en etiquetas en línea.
-
El código del elemento seleccionado se procesa como .HTML. Las configuraciones de importación .HTML como Preservar espacios en blanco o La etiqueta de ruptura (<br/>) crea un nuevo segmento se pueden usar para estos elementos.
Use esta opción cuando el valor del elemento seleccionado contenga marcado .HTML. No se aplica a los hijos del elemento seleccionado, a menos que se especifique lo contrario.
-
Los elementos seleccionados se importarán como Bloqueado.
-
Los atributos seleccionados se importarán como Bloqueado.
-
Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.
-
Las entidades XML en Declaración DTD se importarán para traducción.
-
Deseleccionar si no se desea segmentación.
-
Los comentarios no se importan si los elementos se procesan como HTML, como se indica en la opción Elementos (procesados como HTML).
-
Aplica expresiones regulares para convertir el texto especificado en etiquetas.
-
Ingrese una lista de referencias de caracteres (separadas por comas) en el archivo de salida.
Ejemplo:
Configuración XML usando XPath
Usar el lenguaje de consulta XPath permite la creación de reglas de importación complejas y algunas características adicionales no disponibles en reglas de importación simples.
La expresión XPath debe definir los elementos y/o atributos cuyo texto/valor debe ser traducido y no el nodo de texto real.
Se recomienda familiarizarse con XPath antes de usarlo.
, , y no se procesarán para archivos con más de 10,000 elementos XML.
-
Constituye el contexto de la TM (concordancias del 101%), si corresponde.
-
Importar elementos o atributos de contexto para cada elemento.
-
Importar elementos o la longitud máxima del texto meta para cada elemento. El límite de caracteres de cada segmento se muestra en el panel dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.
-
Mantener vacío para preservar los espacios en blanco en los elementos. Aplicar xml:whitespace='preserve'. //* para preservar todos los espacios en blanco en todos los elementos, o usar una expresión XPath arbitraria.
Vista previa HTML con hoja de estilo XSLT
El lenguaje XSLT (Transformaciones de Lenguaje de Hoja de Estilo Extensible) se puede usar para transformar documentos .XML en formato .HTML para propósitos de vista previa en contexto. En consecuencia, los archivos de vista previa descargados a través de Vista previa de traducción en el menú Documento vienen con extensión HTML. Phrase actualmente soporta XSLT 2.0.
XSLT utilizado para vista previa debe basarse en el objetivo, no en la fuente.
Haga clic en Elegir archivo para importar una hoja de estilo.
Haga clic en Descargar XSLT para descargar la hoja de estilo después de la importación del archivo.
CDATA en archivo XML
CDATA significa Datos de Carácter y se define como bloques de texto que no son procesados por el analizador pero son reconocidos como marcado. Las entidades predefinidas como <,
>
, y &
requieren escritura y son generalmente difíciles de leer en el marcado. En tales casos, se puede usar la sección CDATA.
Si CDATA contiene .HTML incrustado, los elementos XML correspondientes deben ser listados bajo
.Si el archivo fuente contiene CDATA y se utiliza
, entonces CDATA se añade a cada segmento en el archivo completado.CDATA solo será segmentado si hay una clara indicación de un corte de segmento, como puntuación o espaciado.
Fuente:
<text><![CDATA[Translatable text A. Translatable text B.]]></text>
Meta:
<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>
El archivo completado es válido .XML y el visor XML mostrará el texto correctamente como Texto traducible A. Texto traducible B.
Los archivos multilingües se importan como múltiples trabajos bilingües con idiomas mapeados antes de la importación. Se representan con en la tabla trabajos. Si se importa a varios idiomas de destino, el Completado archivo está compuesto por todos los idiomas de destino.
Phrase admite archivos XML que tienen tanto elementos de origen como de destino presentes para todos los párrafos, incluso si el destino está vacío. Cuando la segmentación de origen y destino son diferentes, la segmentación de origen es determinante.
Los elementos de idioma individuales deben ser todos descendientes del mismo elemento trans-unit y un idioma no puede estar contenido dentro del otro. El contenido de origen y destino no puede almacenarse en valores de atributos. Si varios elementos coinciden con la XPath para origen o destino dentro del elemento trans-unit, solo se importa el primero para traducción.
-
Al crear un trabajo, seleccione del panel antes de aplicar las opciones de importación. Si no se especifica, el archivo se importará como estándar .XML.
-
El contenido de las etiquetas del archivo .XML de origen se puede visualizar en el editor haciendo clic en Expandir etiquetas en el menú y se puede editar haciendo clic en F2.
Ejemplo:
Muestra de texto parcialmente traducido del inglés al alemán y francés. Todos <tuv lang="en">
, <tuv lang="de">
y <tuv lang="fr">
son hijos del mismo elemento <tu>
.
<?xml version="1.0" encoding="utf-8"?> <root> Texto no traducible. <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>Primer segmento.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu nota="otra nota de contexto" clave="ID 255" maxlen="18"> <tuv lang="en"> <seg>Segundo segmento.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Opciones de importación
Para la importación de archivos .XML multilingües, se debe utilizar el XPath lenguaje de consulta. Vea el ejemplo anterior para referencia. La expresión XPath define los elementos en los que el texto/valor debe ser traducido y no el nodo de texto real.
-
//tu
-
tuv[@lang='en']/seg
(en relación con el elemento padre//tu
) -
tuv[@lang='de']/seg
(en relación con la pa rentes//tu
) -
tuv[@lang='fr']/seg
(en relación con el elemento padre//tu
) -
Todos los elementos en la fuente o el objetivo se consideran elementos en línea traducibles a menos que se especifique aquí como elementos en línea no traducibles.
-
Aplica expresiones regulares para convertir el texto especificado en etiquetas.
-
Especifique una clave de contexto que se guarda con el segmento en la memoria de traducción y se utiliza para el contexto de coincidencia.
-
Importar elementos o atributos de contexto para cada elemento.
-
Importar elementos o la longitud máxima del objetivo para cada elemento
-
Ingrese una lista de referencias de caracteres (separadas por comas) en el archivo de salida.
Ejemplo:
-
Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.
-
Importa las etiquetas HTML contenidas en el archivo. Las etiquetas se pueden usar con la configuración de importación de archivos HTML. Las etiquetas de párrafo
<p>
crearán nuevos segmentos incluso si no está seleccionado. -
El texto se segmenta por una regla de segmentación general en lugar de un segmento por celda.
Precaución
Aplicar
a un archivo que contiene texto objetivo puede resultar en un número diferente de segmentos en la fuente que en el objetivo. -
Seleccione el estado de confirmación predeterminado y si los segmentos confirmados se agregan automáticamente a TM.
Ejemplo: