El formato de archivo XML no está diseñado para la traducción y requiere configuración adicional para una importación exitosa.
La configuración predeterminada está marcada con un asterisco (*) e importará todos los elementos XML para la traducción. Las opciones de importación se pueden usar para cambiar el tipo de importación.
Los servicios de IA pueden ser muy efectivos para identificar problemas de formato en archivos basados en XML.
Tipos de archivo
-
XML
Opciones de importación
Reglas de importación básicas
-
Solo se importan los elementos seleccionados (p. ej., nombre, título, párrafo). Un asterisco () importa todos los elementos.
-
Solo se importan los atributos seleccionados (p. ej., nombre, título, párrafo). Un asterisco () importa todos los atributos.
-
Si se selecciona la opción , todos los elementos del texto traducible se importan como elementos en línea traducibles.
-
El elemento en línea seleccionado —nombre, título, párrafo— se convertirá en etiquetas y el contenido no será traducible.
Importante
Los problemas con etiquetas son una causa común de errores de exportación (por ejemplo, ), especialmente para tipos de archivo como hojas de cálculo (basadas en MS Excel) y XML. Comprueba siempre que las etiquetas y el formato sean correctos antes de exportar archivos. Esto se puede hacer realizando comprobaciones de control de calidad.
-
Los elementos que son vecinos de nodos de texto serán convertidos automáticamente en etiquetas en línea.
-
El código del elemento seleccionado se procesa como HTML. Se pueden usar configuraciones de importación para HTML para estos elementos, tales como Preservar espacios en blanco o Etiqueta de salto de línea (<br/>) para crear un nuevo segmento.
Usa esta opción cuando el valor del elemento seleccionado contenga marcado HTML. No se aplica a los elementos secundarios del elemento seleccionado, a menos que se especifique lo contrario.
-
Los elementos seleccionados se importarán como Bloqueados.
-
Los atributos seleccionados se importarán como Bloqueados.
-
Introduce una lista de referencias de caracteres (separadas por comas) en el archivo de salida.
Ejemplo:
-
Aplica expresiones regulares para convertir el texto especificado en etiquetas.
-
Los mensajes ICU se convierten automáticamente en etiquetas. Cuando un segmento contiene elementos en línea, se omite el análisis de ICU para ese segmento. Los segmentos sin elementos en línea se analizan con normalidad.
-
Las entidades XML en Declaración DTD se importarán para ser traducidas.
-
-
Los comentarios no se importan si los elementos se procesan como HTML, tal y como se indica en la opción Elementos (procesados como HTML).
-
Selecciona esta opción para evitar la segmentación dentro de las etiquetas de pares XML o subelementos. Esto es útil si el XML contiene estructuras anidadas donde la segmentación rompería el significado lógico del texto.
-
Se puede cargar una hoja de estilo XSL y generar un archivo de vista previa legible a partir de ella.
Configurar XML con XPath
Usar el lenguaje de consulta XPath permite crear reglas de importación complejas y algunas características adicionales que no están disponibles en las reglas de importación simples.
La expresión XPath debe definir los elementos y/o atributos cuyo texto o valor se debe traducir, no el nodo de texto real.
Te recomendamos que te familiarices con XPath antes de usarlo.
Los siguientes elementos no se procesarán para archivos con más de 10 000 elementos XML: , , y .
-
Constituye el contexto de la TM (concordancias del 101%), si corresponde.
-
Importa elementos o atributos de contexto para cada elemento.
-
Importa elementos o la longitud máxima del texto meta para cada elemento. El límite de caracteres de cada segmento se muestra en el panel dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.
-
Debe quedarse vacío para preservar los espacios en blanco en los elementos. Aplica xml:whitespace='preserve'. //* para dejar todos los espacios en blanco en todos los elementos, o usa una expresión XPath arbitraria.
-
Especifica los elementos o atributos XML que no deben segmentarse. Introduce una expresión XPath que identifique los nodos que excluir. Cualquier texto extraído de estos nodos se mantendrá como un solo segmento en lugar de dividirse en unidades más pequeñas.
Ingresa //element[@attr='value'] para excluir todos los nodos
<element>que contienen el atributoattr="value"de la segmentación.
Vista previa de HTML con hoja de estilo XSLT
El lenguaje XSLT (Extensible Stylesheet Language Transformations) se puede usar para transformar documentos en XML a formato HTML para realizar una vista previa en contexto. Por lo tanto, los archivos de vista previa descargados a través de Vista previa de la traducción en el menú Documento vienen con extensión HTML. Phrase actualmente admite XSLT 2.0.
El XSLT utilizado para la vista previa debe basarse en el archivo meta, no en el fuente.
Haz clic en Elegir archivo para importar una hoja de estilo.
Haz clic en Descargar XSLT para descargar la hoja de estilo después de importar el archivo.
CDATA en archivo XML
CDATA significa datos de carácter y se define como bloques de texto que el analizador no procesa, pero que se reconocen como marcado. Las entidades predefinidas como <, > y & requieren ser escritas y, en general, son difíciles de leer en el marcado. En tales casos, se puede usar la sección CDATA.
Si CDATA contiene HTML incrustado, los elementos XML correspondientes deben aparecer en .
Si el archivo fuente contiene CDATA y se utiliza , luego se agrega CDATA a cada segmento en el archivo completado.
CDATA solo se segmentará si hay una clara indicación de un corte de segmento, como puntuación o espacios.
Fuente:
<text><![CDATA[Texto traducible A. Texto traducible B.]]></text>
Meta:
<text><![CDATA[Texto traducible A.]]><![CDATA[ ]]><![CDATA[Texto traducible B.]]></text>
El archivo completado es un XML válido y el visor XML mostrará el texto correctamente como Texto traducible A. Texto traducible B.
Los archivos multilingües se importan como múltiples trabajos bilingües con los idiomas asignados antes de importar. Se representan con en la tabla de trabajos. Si se importa en varios idiomas de destino, el archivo completado estará compuesto por todos los idiomas de destino.
Phrase admite archivos XML que tienen elementos de fuente y meta presentes para todos los párrafos, incluso si el contenido meta está vacío. Cuando la segmentación es diferente entre el contenido fuente y meta, tendrá más importancia la segmentación del contenido fuente.
Los elementos de idioma individuales deben ser todos descendientes de la misma unidad de traducción (trans-unit) y un idioma no puede estar contenido dentro de otro. El contenido fuente y meta no puede almacenarse en valores de atributo. Si varios elementos coinciden con el XPath para fuente o meta dentro del elemento trans-unit, solo se importa el primero para la traducción.
-
Al crear un trabajo, selecciona desde el panel antes de aplicar las opciones de importación. Si no se especifica, el archivo se importará como un XML estándar.
-
El contenido de las etiquetas del archivo XML fuente se puede visualizar en el editor haciendo clic en Expandir etiquetas en el menú y editar haciendo clic en F2.
Ejemplo:
Muestra de texto parcialmente traducido del inglés al alemán y al francés. Los elementos <tuv lang="en"></tuv>, <tuv lang="de"></tuv> y <tuv lang="fr"></tuv> son elementos secundarios del mismo elemento: <tu></tu>.
<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16">
<tuv lang="en">
<seg>First segment.</seg>
</tuv>
<tuv lang="de">
<seg>Erste segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18">
<tuv lang="en">
<seg>Second segment.</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
Opciones de importación
Para importar archivos XML multilingües, se debe usar el lenguaje de consulta XPath. Observa el ejemplo anterior como referencia. La expresión XPath define los elementos en los que el texto/valor debe ser traducido, no el nodo de texto real.
-
//tu -
tuv[@lang='en']/seg(en relación con el elemento raíz//tu) -
Todos los elementos en el contenido fuente o meta se consideran elementos en línea traducibles, a menos que se especifique aquí como elementos en línea no traducibles.
-
Especifica una clave de contexto que se guarda con el segmento en la memoria de traducción y se utiliza para la concordancia de contexto.
-
Importa elementos o atributos de contexto para cada elemento.
-
Importa elementos o la longitud máxima de la meta para cada elemento
-
Introduce una lista de referencias de caracteres (separadas por comas) en el archivo de salida.
Ejemplo:
-
Aplica expresiones regulares para convertir el texto especificado en etiquetas.
-
Los mensajes ICU se convierten automáticamente en etiquetas. Cuando un segmento contiene elementos en línea, se omite el análisis de ICU para ese segmento. Los segmentos sin elementos en línea se analizan con normalidad.
-
Importa las etiquetas HTML contenidas en el archivo. Las etiquetas pueden usarse con la configuración de importación de archivos HTML. Las etiquetas de párrafo
<p>crearán nuevos segmentos incluso si no se ha seleccionado la opción . -
Importa las etiquetas HTML contenidas en el archivo. Las etiquetas pueden usarse con la configuración de importación de archivos HTML.
-
El texto se segmenta mediante una regla de segmentación general en lugar de en un segmento por celda.
Atención
Aplicar la opción de a un archivo que contiene texto meta puede resultar en un número diferente de segmentos en el texto fuente en comparación con el texto meta.
-
Selecciona el estado de confirmación predeterminado y si quieres que los segmentos confirmados se agreguen automáticamente al TM.
-
Se puede cargar una hoja de estilo XSL y generar un archivo de vista previa legible a partir de ella.
Ejemplo: