Configuración de importación de archivos

.XML - Extensible Markup Language (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

El formato de archivo .XML no está diseñado para traducción y requiere configuraciones adicionales para importarse correctamente.

Las configuraciones predeterminadas se marcan con un asterisco (*) e importarán todos los elementos XML para su traducción. Se pueden utilizar opciones para importar para cambiar el comportamiento al importar.

Los chatbots IA pueden ser muy eficaces a la hora de identificar problemas de formato en archivos basados en .XML.

Tipos de archivo

  • .XML

Opciones de importación

Reglas claras para importar

  • Elementos

    Solo se importan los elementos seleccionados (es decir, nombre, título, párr). Un asterisco (*) importa todos los elementos.

  • Atributos

    Solo se importan los atributos seleccionados (es decir, nombre, título, párr). Un asterisco (*) importa todos los atributos.

  • Elementos en línea traducibles

    Si se selecciona la opción Identificar elementos automáticamente en línea, todos los elementos del texto traducible se importarán como elementos traducibles en línea.

  • Elementos en línea no traducibles

    Los elementos en línea name, title, para seleccionados se convertirán en tags y el contenido no será traducible.

    Importante

    Los problemas con tags son una causa común de errores al exportar, especialmente para tipos de archivos como hojas de cálculo (basadas en MS Excel) y .XML. Asegúrate siempre de que los tags y el formato son correctos antes de exportar archivos realizando controles de calidad.

  • Identificar los elementos en línea automáticamente

    Los elementos vecinos de nodos de texto se convertirán automáticamente en tags en línea.

  • Elementos (procesados como HTML)

    El código de los elementos seleccionados se procesa como .HTML. Configuración .HTML importada como Conservar espacios en blanco o Saltar etiqueta (<br/>) crea un nuevo segmento se puede utilizar para estos elementos.

    Use esta opción cuando el valor del elemento seleccionado contenga una marca .HTML. No se aplica a los elementos secundarios seleccionados, a menos que se especifique lo contrario.

  • Elementos bloqueados

    Los elementos seleccionados se importarán como Bloqueados.

  • Atributos bloqueados

    Los atributos seleccionados se importarán como Bloqueados.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Importar entidades XML

    Las entidades XML de la Declaración DTD se importarán para su traducción.

  • Segmentar XML

    Anular la selección si no se desea segmentación.

  • Importar comentarios

    Los comentarios no se importan si los elementos se procesan como HTML, como se indica en la opción Elementos (procesados como HTML).

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Convertir a entidades de carácteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3; usar &quot; ,&#x3A3; . & y < siempre se exportan como &amp; y &lt; respectivamente.

Configuraciones XML mediante XPath

El uso del idioma de consulta XPath permite crear reglas de importación complejas y algunas funciones adicionales no disponibles en las reglas de importación simple.

La expresión XPath debe definir los elementos y/o atributos cuyo texto/valor debe traducirse y no el nodo de texto real.

Se recomienda familiarizarse con XPath antes de usar.

No se procesarán nota de contexto, clave de contexto y longitud meta máxima para archivos con más de 10.000 elementos XML.

  • Clave de contexto

    Constituye el contexto de la TM (concordancias del 101%), si corresponde.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud máxima del texto meta para cada elemento. El límite de caracteres de cada segmento se muestra en el panel Nota de contexto dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.

  • Dejar espacios en blanco

    Keep empty para conservar los espacios en blanco en los elementos. Aplica xml:whitespace='preserve'. / /* para preservar todos los espacios en blanco en todos los elementos, o usa una expresión XPath arbitraria.

Vista previa HTML con hoja de estilos XSLT

Se puede utilizar idioma XSLT (formato trans de idioma extensible de la hoja de estilos) para transformar documentos .XML en formato .HTML con fines de vista previa en contexto. Por consiguiente, los archivos vista previa descargados mediante traducción vista previa en el menú Documento vienen con extensión HTML. phrase admite actualmente XSLT 2.0.

Haz clic en Seleccionar archivo para importar una hoja de estilos.

Haga clic en Descargar XSLT para descargar la hoja de estilo después de importar archivos.

CDATA en archivo XML

CDATA significa Datos de caracteres y se define como bloques de texto que no son procesados por el analizador pero que se reconocen como marcados. Entidades predefinidas como &lt;, &gt; y &amp; requieren mecanografía y generalmente son difíciles de leer en el marcado. En tales casos, se puede utilizar la sección CDATA.

Si CDATA contiene .HTML incrustado, los elementos XML correspondientes se deben enumerar en Elementos (procesados como HTML).

Si el archivo fuente contiene CDATA y se utiliza el segmento XML, se añade CDATA a cada segmento del archivo Terminado.

Los CDATA solo se segmentarán si hay una indicación borra de un salto de segmento como puntuación o espaciado.

Fuente:

<text><![CDATA[Texto traducible A. Texto traducible B.]]></text>

Target:

<text><![CDATA[Texto traducible A.]]><![CDATA[ ]]><![CDATA[Texto traducible B.]]></text>

El archivo Terminado es válido .XML y el visor XML mostrará el texto correctamente como texto traducible A. Texto traducible B.

Configuración específica de la aplicación

Wordpress XML

Configuraciones recomendadas para WordPress XML:

  • XML

    XPath

  • Elementos y atributos

    / //*[local-name()='codificado']|/ / descripción|//title

  • Elementos (procesados como HTML)

    / //*[local-name()='codificado']|/ / descripción|//title

  • Convertir en etiquetas de Phrase

    (\[[^\]]++\])++

Selecciona Conservar espacios en blanco en configuración HTML.

XML multilingüe

Los archivos multilingües se importan como varios trabajos bilingües con idiomas asignados antes de la importación. Se representan con multilingual_xml.png en la tabla de trabajos. Si se importa a varios idiomas meta, el archivo Terminado se compone de todos los idiomas meta.

phrase admite archivos XML que tienen elementos fuente y meta presentes para todos los párrafos, incluso si la meta está empty. Cuando la segmentación fuente y meta son diferentes, la segmentación fuente es determinante.

Los elementos de un mismo idioma deben ser descendientes del mismo elemento transunitario y un idioma no puede estar contenido dentro del otro. El contenido fuente y meta no se puede almacenar en valores de atributo. Si varios elementos concordancias con XPath para fuente o meta dentro del elemento trans-unidad, solo se importa el primero para traducción.

  • Al crear un trabajo, selecciona XML multilingüe en el panel Tipo de archivo antes de aplicar Opciones de importación. Si no se especifica, el archivo se importará como .XML estándar.

  • El contenido de las etiquetas del archivo .XML fuente se puede visualizar en el editor haciendo clic en Expandir tags en el menú Herramientas y editarlo haciendo clic en F2.

Ejemplo:

Ejemplo de texto parcialmente traducido de inglés a alemán y francés. Todos los <tuv lang="en">, <tuv lang="de"> y <tuv lang="fr"> son hijos del mismo <tu> elemento.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Primer segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Segmento Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Segundo segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opciones de importación

Para importar archivos .XML multilingües se debe utilizar el idioma de consulta XPath. Ver ejemplo anterior como referencia. La expresión XPath define los elementos en los que se debe traducir el texto/valor y no el nodo de texto real.

  • Elementos que contienen subelementos fuente y meta

    //tu

  • Elementos que contienen texto fuente

    tuv[@lang='en']/seg (en relación con el elemento raíz //tu)

  • Elementos que contienen texto meta

    tuv[@lang='de']/seg (en relación con el elemento de renta de la nota de contexto pa //tu)

  • Elementos que contienen texto meta

    tuv[@lang='fr']/seg (en relación con el elemento raíz //tu)

  • Elementos en línea no traducibles

    Todos los elementos fuente o meta se consideran elementos traducibles en línea a menos que se especifiquen aquí como elementos no traducibles en línea.

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Clave de contexto

    Especificar una clave de contexto que se guarde con el segmento en la memoria de traducción y se utilice para el contexto de concordancia.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud máxima del texto meta para cada elemento

  • Convertir a entidades de carácteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3; usar &quot; ,&#x3A3; . & y < siempre se exportan como &amp; y &lt; respectivamente.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Usar subfiltro HTML 

    Importa las etiquetas HTML contenidas en el archivo. Las etiquetas pueden usarse con configuración para Importar archivos HTML. Las paragraph tags <p> crearán nuevos segmentos incluso si el segmento XML multilingüe no está seleccionado.

  • Segmentar XLS multilingüe

    El texto se segmenta mediante una regla segmentación general en lugar de un segmento por celda.

    Precaución

    Aplicar XML multilingüe segmento a un archivo que contenga texto meta puede dar lugar a un número diferente de segmentos en la fuente que en la meta.

  • Cambiar el estado de segmento meta no vacío 

    Selecciona estado predeterminado de confirmación y si los segmentos confirmados se agregan automáticamente a TM.

Ejemplo:

Si un .XML multilingüe contiene un espacio de nombres, el XPath podría ser el siguiente:

  • Elementos que contienen subelementos fuente y meta

    //*[local-name()='trans-unit']

  • Elementos que contienen texto fuente

    *[local-name()='source']

  • Elementos que contienen texto meta

    *[local-name()='target']

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.