Configuración de importación de archivos

.XML - Extensible Markup Language (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

El formato de archivo .XML no está diseñado para la traducción y requiere configuraciones adicionales para una importación exitosa.

Las configuraciones predeterminadas están marcadas con un asterisco (*) e importarán todos los elementos XML para traducción. Las opciones de importación se pueden usar para cambiar el comportamiento de importación.

Los servicios de IA pueden ser muy efectivos para identificar problemas de formato en archivos basados en .XML.

Tipos de archivo

  • .XML

Opciones de importación

Reglas de importación simples

  • Elementos

    Solo se importan los elementos seleccionados (es decir, nombre, título, párrafo). Un asterisco (*) importa todos los elementos.

  • Atributos

    Solo se importan los atributos seleccionados (es decir, nombre, título, párrafo). Un asterisco (*) importa todos los atributos.

  • Elementos en línea traducibles

    Si la opción Identificar elementos en línea automáticamente está seleccionada, todos los elementos en el texto traducible se importan como elementos Traducibles en línea.

  • Elementos en línea no traducibles

    El elemento en línea seleccionado nombre, título, párrafo se convertirá en etiquetas y el contenido no será traducible.

    Importante

    Los problemas con etiquetas son una causa común de errores de exportación (por ejemplo, No se pudo generar el archivo), especialmente para tipos de archivos como hojas de cálculo (basados en MS Excel) y .XML. Siempre asegúrese de que las etiquetas y el formato sean correctos antes de exportar archivos ejecutando verificaciones de control de calidad.

  • Identificar los elementos en línea automáticamente

    Los elementos que son vecinos de nodos de texto se convertirán automáticamente en etiquetas en línea.

  • Elementos (procesados como HTML)

    El código del elemento seleccionado se procesa como .HTML. Las configuraciones de importación .HTML como Preservar espacios en blanco o La etiqueta de ruptura (<br/>) crea un nuevo segmento se pueden usar para estos elementos.

    Use esta opción cuando el valor del elemento seleccionado contenga marcado .HTML. No se aplica a los hijos del elemento seleccionado, a menos que se especifique lo contrario.

  • Elementos bloqueados

    Los elementos seleccionados se importarán como Bloqueado.

  • Atributos bloqueados

    Los atributos seleccionados se importarán como Bloqueado.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Importar entidades XML

    Las entidades XML en Declaración DTD se importarán para traducción.

  • Segmentar XML

    Deseleccionar si no se desea segmentación.

  • Importar comentarios

    Los comentarios no se importan si los elementos se procesan como HTML, como se indica en la opción Elementos (procesados como HTML).

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Convertir a entidades de carácteres

    Ingrese una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3; use &quot;,&#x3A3;. & y < siempre se exportan como &amp; y &lt; respectivamente.

Configuración XML usando XPath

Usar el lenguaje de consulta XPath permite la creación de reglas de importación complejas y algunas características adicionales no disponibles en reglas de importación simples.

La expresión XPath debe definir los elementos y/o atributos cuyo texto/valor debe ser traducido y no el nodo de texto real.

Se recomienda familiarizarse con XPath antes de usarlo.

Nota de contexto, Clave de contexto, y Longitud máxima del objetivo no se procesarán para archivos con más de 10,000 elementos XML.

  • Clave de contexto

    Constituye el contexto de la TM (concordancias del 101%), si corresponde.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud máxima del texto meta para cada elemento. El límite de caracteres de cada segmento se muestra en el panel Nota de contexto dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.

  • Dejar espacios en blanco

    Mantener vacío para preservar los espacios en blanco en los elementos. Aplicar xml:whitespace='preserve'. //* para preservar todos los espacios en blanco en todos los elementos, o usar una expresión XPath arbitraria.

Vista previa HTML con hoja de estilo XSLT

El lenguaje XSLT (Transformaciones de Lenguaje de Hoja de Estilo Extensible) se puede usar para transformar documentos .XML en formato .HTML para propósitos de vista previa en contexto. En consecuencia, los archivos de vista previa descargados a través de Vista previa de traducción en el menú Documento vienen con extensión HTML. Phrase actualmente soporta XSLT 2.0.

XSLT utilizado para vista previa debe basarse en el objetivo, no en la fuente.

Haga clic en Elegir archivo para importar una hoja de estilo.

Haga clic en Descargar XSLT para descargar la hoja de estilo después de la importación del archivo.

CDATA en archivo XML

CDATA significa Datos de Carácter y se define como bloques de texto que no son procesados por el analizador pero son reconocidos como marcado. Las entidades predefinidas como &lt;, &gt;, y &amp; requieren escritura y son generalmente difíciles de leer en el marcado. En tales casos, se puede usar la sección CDATA.

Si CDATA contiene .HTML incrustado, los elementos XML correspondientes deben ser listados bajo Elementos (procesados como HTML).

Si el archivo fuente contiene CDATA y se utiliza Segmento XML, entonces CDATA se añade a cada segmento en el archivo completado.

CDATA solo será segmentado si hay una clara indicación de un corte de segmento, como puntuación o espaciado.

Fuente:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Meta:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

El archivo completado es válido .XML y el visor XML mostrará el texto correctamente como Texto traducible A. Texto traducible B.

Configuración Específica de la Aplicación

XML de Wordpress

Configuraciones recomendadas para XML de Wordpress:

  • XML

    XPath

  • Elementos y atributos

    //*[local-name()='encoded']|//description|//title

  • Elementos (procesados como HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en etiquetas de Phrase

    (\[[^\]]++\])++

Seleccionar Preservar espacios en blanco bajo HTML configuraciones.

XML Multilingüe

Los archivos multilingües se importan como múltiples trabajos bilingües con idiomas mapeados antes de la importación. Se representan con multilingual_xml.png en la tabla trabajos. Si se importa a varios idiomas de destino, el Completado archivo está compuesto por todos los idiomas de destino.

Phrase admite archivos XML que tienen tanto elementos de origen como de destino presentes para todos los párrafos, incluso si el destino está vacío. Cuando la segmentación de origen y destino son diferentes, la segmentación de origen es determinante.

Los elementos de idioma individuales deben ser todos descendientes del mismo elemento trans-unit y un idioma no puede estar contenido dentro del otro. El contenido de origen y destino no puede almacenarse en valores de atributos. Si varios elementos coinciden con la XPath para origen o destino dentro del elemento trans-unit, solo se importa el primero para traducción.

  • Al crear un trabajo, seleccione XML multilingüe del panel Tipo de archivo antes de aplicar las opciones de importación. Si no se especifica, el archivo se importará como estándar .XML.

  • El contenido de las etiquetas del archivo .XML de origen se puede visualizar en el editor haciendo clic en Expandir etiquetas en el menú Herramienta y se puede editar haciendo clic en F2.

Ejemplo:

Muestra de texto parcialmente traducido del inglés al alemán y francés. Todos <tuv lang="en">, <tuv lang="de"> y <tuv lang="fr"> son hijos del mismo elemento <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Primer segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu nota="otra nota de contexto" clave="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Segundo segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opciones de importación

Para la importación de archivos .XML multilingües, se debe utilizar el XPath lenguaje de consulta. Vea el ejemplo anterior para referencia. La expresión XPath define los elementos en los que el texto/valor debe ser traducido y no el nodo de texto real.

  • Elementos que contienen subelementos fuente y meta

    //tu

  • Elementos que contienen texto fuente

    tuv[@lang='en']/seg (en relación con el elemento padre //tu)

  • Elementos que contienen texto meta

    tuv[@lang='de']/seg (en relación con la panota de contexto rentes //tu)

  • Elementos que contienen texto meta

    tuv[@lang='fr']/seg (en relación con el elemento padre //tu)

  • Elementos en línea no traducibles

    Todos los elementos en la fuente o el objetivo se consideran elementos en línea traducibles a menos que se especifique aquí como elementos en línea no traducibles.

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Clave de contexto

    Especifique una clave de contexto que se guarda con el segmento en la memoria de traducción y se utiliza para el contexto de coincidencia.

  • nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud máxima del objetivo para cada elemento

  • Convertir a entidades de carácteres

    Ingrese una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3; use &quot;,&#x3A3;. & y < siempre se exportan como &amp; y &lt; respectivamente.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Usar subfiltro HTML 

    Importa las etiquetas HTML contenidas en el archivo. Las etiquetas se pueden usar con la configuración de importación de archivos HTML. Las etiquetas de párrafo <p> crearán nuevos segmentos incluso si Segmento XML multilingüe no está seleccionado.

  • Segmentar XLS multilingüe

    El texto se segmenta por una regla de segmentación general en lugar de un segmento por celda.

    Precaución

    Aplicar Segmento XML multilingüe a un archivo que contiene texto objetivo puede resultar en un número diferente de segmentos en la fuente que en el objetivo.

  • Cambiar el estado de segmento meta no vacío 

    Seleccione el estado de confirmación predeterminado y si los segmentos confirmados se agregan automáticamente a TM.

Ejemplo:

Si un .XML multilingüe contiene un espacio de nombres, el XPath podría ser el siguiente:

  • Elementos que contienen subelementos fuente y meta

    //*[local-name()='trans-unit']

  • Elementos que contienen texto fuente

    *[local-name()='fuente']

  • Elementos que contienen texto meta

    *[local-name()='target']

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.