Configuración de importación de archivos

XML - Lenguaje de marcado extensible (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

El formato de archivo XML no está diseñado para la traducción y requiere configuración adicional para una importación exitosa.

La configuración predeterminada está marcada con un asterisco (*) e importará todos los elementos XML para la traducción. Las opciones de importación se pueden usar para cambiar el tipo de importación.

Los servicios de IA pueden ser muy efectivos para identificar problemas de formato en archivos basados en XML.

Tipos de archivo

  • XML

Opciones de importación

Reglas de importación básicas

  • Elementos

    Solo se importan los elementos seleccionados (p. ej., nombre, título, párrafo). Un asterisco (*) importa todos los elementos.

  • Atributos

    Solo se importan los atributos seleccionados (p. ej., nombre, título, párrafo). Un asterisco (*) importa todos los atributos.

  • Elementos en línea traducibles

    Si se selecciona la opción Identificar los elementos en línea automáticamente, todos los elementos del texto traducible se importan como elementos en línea traducibles.

  • Elementos en línea no traducibles

    El elemento en línea seleccionado —nombre, título, párrafo— se convertirá en etiquetas y el contenido no será traducible.

    Importante

    Los problemas con etiquetas son una causa común de errores de exportación (por ejemplo, que no se pueda generar el archivo), especialmente para tipos de archivo como hojas de cálculo (basadas en MS Excel) y XML. Comprueba siempre que las etiquetas y el formato sean correctos antes de exportar archivos. Esto se puede hacer realizando comprobaciones de control de calidad.

  • Identificar los elementos en línea automáticamente

    Los elementos que son vecinos de nodos de texto serán convertidos automáticamente en etiquetas en línea.

  • Elementos (procesados como HTML)

    El código del elemento seleccionado se procesa como HTML. Se pueden usar configuraciones de importación para HTML para estos elementos, tales como Preservar espacios en blanco o Etiqueta de salto de línea (<br/>) para crear un nuevo segmento.

    Usa esta opción cuando el valor del elemento seleccionado contenga marcado HTML. No se aplica a los elementos secundarios del elemento seleccionado, a menos que se especifique lo contrario.

  • Elementos bloqueados

    Los elementos seleccionados se importarán como Bloqueados.

  • Atributos bloqueados

    Los atributos seleccionados se importarán como Bloqueados.

  • Convertir a entidades de caracteres

    Introduce una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3;usa &quot;,&#x3A3; . & y < siempre se exportan como &amp; y &lt; respectivamente.

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Cuando un segmento contiene elementos en línea, se omite el análisis de ICU para ese segmento. Los segmentos sin elementos en línea se analizan con normalidad.

  • Importar entidades XML

    Las entidades XML en Declaración DTD se importarán para ser traducidas.

  • Expandir entidades generales personalizadas

  • Importar comentarios

    Los comentarios no se importan si los elementos se procesan como HTML, tal y como se indica en la opción Elementos (procesados como HTML).

  • Excluir subelementos de la segmentación

    Selecciona esta opción para evitar la segmentación dentro de las etiquetas de pares XML o subelementos. Esto es útil si el XML contiene estructuras anidadas donde la segmentación rompería el significado lógico del texto.

  • Crear archivo de vista previa en XSLT

    Se puede cargar una hoja de estilo XSL y generar un archivo de vista previa legible a partir de ella.

Configurar XML con XPath

Usar el lenguaje de consulta XPath permite crear reglas de importación complejas y algunas características adicionales que no están disponibles en las reglas de importación simples.

La expresión XPath debe definir los elementos y/o atributos cuyo texto o valor se debe traducir, no el nodo de texto real.

Te recomendamos que te familiarices con XPath antes de usarlo.

Los siguientes elementos no se procesarán para archivos con más de 10 000 elementos XML: Nota de contexto, Clave de contexto, y Longitud máxima de meta.

  • Clave de contexto

    Constituye el contexto de la TM (concordancias del 101%), si corresponde.

  • Nota de contexto

    Importa elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importa elementos o la longitud máxima del texto meta para cada elemento. El límite de caracteres de cada segmento se muestra en el panel Nota de contexto dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.

  • Dejar espacios en blanco

    Debe quedarse vacío para preservar los espacios en blanco en los elementos. Aplica xml:whitespace='preserve'. //* para dejar todos los espacios en blanco en todos los elementos, o usa una expresión XPath arbitraria.

  • Nodos excluidos de la segmentación

    Especifica los elementos o atributos XML que no deben segmentarse. Introduce una expresión XPath que identifique los nodos que excluir. Cualquier texto extraído de estos nodos se mantendrá como un solo segmento en lugar de dividirse en unidades más pequeñas.

    Ingresa //element[@attr='value'] para excluir todos los nodos <element> que contienen el atributo attr="value" de la segmentación.

Vista previa de HTML con hoja de estilo XSLT

El lenguaje XSLT (Extensible Stylesheet Language Transformations) se puede usar para transformar documentos en XML a formato HTML para realizar una vista previa en contexto. Por lo tanto, los archivos de vista previa descargados a través de Vista previa de la traducción en el menú Documento vienen con extensión HTML. Phrase actualmente admite XSLT 2.0.

El XSLT utilizado para la vista previa debe basarse en el archivo meta, no en el fuente.

Haz clic en Elegir archivo para importar una hoja de estilo.

Haz clic en Descargar XSLT para descargar la hoja de estilo después de importar el archivo.

CDATA en archivo XML

CDATA significa datos de carácter y se define como bloques de texto que el analizador no procesa, pero que se reconocen como marcado. Las entidades predefinidas como &lt;, &gt; y &amp; requieren ser escritas y, en general, son difíciles de leer en el marcado. En tales casos, se puede usar la sección CDATA.

Si CDATA contiene HTML incrustado, los elementos XML correspondientes deben aparecer en Elementos (procesados como HTML).

Si el archivo fuente contiene CDATA y se utiliza Segment XML, luego se agrega CDATA a cada segmento en el archivo completado.

CDATA solo se segmentará si hay una clara indicación de un corte de segmento, como puntuación o espacios.

Fuente:

<text><![CDATA[Texto traducible A. Texto traducible B.]]></text>

Meta:

<text><![CDATA[Texto traducible A.]]><![CDATA[ ]]><![CDATA[Texto traducible B.]]></text>

El archivo completado es un XML válido y el visor XML mostrará el texto correctamente como Texto traducible A. Texto traducible B.

Configuración específica de la aplicación

Wordpress XML

Configuración recomendada para WordPress XML:

  • XML

    XPath

  • Elementos y atributos

    //*[local-name()='encoded']|//description|//title

  • Elementos (procesados como HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en etiquetas de Phrase

    (\[[^\]]++\])++

Selecciona Dejar espacios en blanco en la configuración de HTML.

XML multilingüe

Los archivos multilingües se importan como múltiples trabajos bilingües con los idiomas asignados antes de importar. Se representan con multilingual_xml.png en la tabla de trabajos. Si se importa en varios idiomas de destino, el archivo completado estará compuesto por todos los idiomas de destino.

Phrase admite archivos XML que tienen elementos de fuente y meta presentes para todos los párrafos, incluso si el contenido meta está vacío. Cuando la segmentación es diferente entre el contenido fuente y meta, tendrá más importancia la segmentación del contenido fuente.

Los elementos de idioma individuales deben ser todos descendientes de la misma unidad de traducción (trans-unit) y un idioma no puede estar contenido dentro de otro. El contenido fuente y meta no puede almacenarse en valores de atributo. Si varios elementos coinciden con el XPath para fuente o meta dentro del elemento trans-unit, solo se importa el primero para la traducción.

  • Al crear un trabajo, selecciona XML multilingüe desde el panel Tipo de archivo antes de aplicar las opciones de importación. Si no se especifica, el archivo se importará como un XML estándar.

  • El contenido de las etiquetas del archivo XML fuente se puede visualizar en el editor haciendo clic en Expandir etiquetas en el menú Herramienta y editar haciendo clic en F2.

Ejemplo:

Muestra de texto parcialmente traducido del inglés al alemán y al francés. Los elementos <tuv lang="en"></tuv>, <tuv lang="de"></tuv> y <tuv lang="fr"></tuv> son elementos secundarios del mismo elemento: <tu></tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>First segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Second segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opciones de importación

Para importar archivos XML multilingües, se debe usar el lenguaje de consulta XPath. Observa el ejemplo anterior como referencia. La expresión XPath define los elementos en los que el texto/valor debe ser traducido, no el nodo de texto real.

  • Elementos que contienen subelementos fuente y meta

    //tu

  • Elementos que contienen texto fuente

    tuv[@lang='en']/seg (en relación con el elemento raíz //tu)

  • Elementos en línea no traducibles

    Todos los elementos en el contenido fuente o meta se consideran elementos en línea traducibles, a menos que se especifique aquí como elementos en línea no traducibles.

  • Clave de contexto

    Especifica una clave de contexto que se guarda con el segmento en la memoria de traducción y se utiliza para la concordancia de contexto.

  • Nota de contexto

    Importa elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importa elementos o la longitud máxima de la meta para cada elemento

  • Convertir a entidades de caracteres

    Introduce una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como &quot;, el carácter Σ se representaría como &#x3A3;usa &quot;,&#x3A3; . & y < siempre se exportan como &amp; y &lt; respectivamente.

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Cuando un segmento contiene elementos en línea, se omite el análisis de ICU para ese segmento. Los segmentos sin elementos en línea se analizan con normalidad.

  • Usar subfiltro HTML 

    Importa las etiquetas HTML contenidas en el archivo. Las etiquetas pueden usarse con la configuración de importación de archivos HTML. Las etiquetas de párrafo <p> crearán nuevos segmentos incluso si no se ha seleccionado la opción Segmento multilingüe XML.

  • Usar subfiltro HTML

    Importa las etiquetas HTML contenidas en el archivo. Las etiquetas pueden usarse con la configuración de importación de archivos HTML.

  • Segmentar XLS multilingüe

    El texto se segmenta mediante una regla de segmentación general en lugar de en un segmento por celda.

    Atención

    Aplicar la opción de Segmento XML multilingüe a un archivo que contiene texto meta puede resultar en un número diferente de segmentos en el texto fuente en comparación con el texto meta.

  • Cambiar el estado de segmento meta no vacío 

    Selecciona el estado de confirmación predeterminado y si quieres que los segmentos confirmados se agreguen automáticamente al TM.

  • Crear archivo de vista previa en XSLT

    Se puede cargar una hoja de estilo XSL y generar un archivo de vista previa legible a partir de ella.

Ejemplo:

Si un XML multilingüe contiene un espacio de nombres, el XPath podría ser el siguiente:

  • Elementos que contienen subelementos fuente y meta

    //*[local-name()='trans-unit']

  • Elementos que contienen texto fuente

    *[local-name()='source']

  • Elementos que contienen texto meta

    *[local-name()='target']

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.