Configuración de importación de archivos

.XML - idioma extensible de marcado (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

El formato de archivo .XML no está diseñado para traducción y requiere configuraciones adicionales para importarlo correctamente.

Las configuraciones predeterminadas se marcan con un asterisco (*) e importarán todos los elementos XML para su traducción. Las opciones Importar se pueden utilizar para cambiar el comportamiento Importar.

Tipos de archivo

  • .XML

Opciones de importación

Reglas claras para importar

  • Elementos

    Solo se importan los elementos seleccionados (nombre, título, párr). Un asterisco (*) importa todos los elementos.

  • Atributos

    Solo se importan los atributos seleccionados (por ejemplo, nombre, título, párr). Un asterisco (*) importa todos los atributos.

  • Elementos en línea traducibles

    Si se selecciona la opción Identificar elementos automáticamente en línea, todos los elementos del texto traducible se importarán como elementos traducibles en línea.

  • Elementos en línea no traducibles

    Los elementos en línea nombre, título, para seleccionados se convertirán en etiquetas y el contenido no será traducible.

  • Identificar los elementos en línea automáticamente

    Los elementos vecinos de los nodos de texto se convertirán automáticamente en etiquetas en línea.

  • Elementos (procesados como HTML)

    El código de los elementos seleccionados se procesa como .HTML. Configuración para importar .HTML, como preservar espacios en blanco o saltar etiqueta (<br/>) crea un nuevo segmento que puede usarse para estos elementos.

    Use esta opción cuando el valor del elemento seleccionado contenga un marcado .HTML. No se aplica a los elementos subordinados seleccionados, a menos que se especifique lo contrario.

  • Elementos bloqueados

    Los elementos seleccionados se importarán como Bloqueados.

  • Atributos bloqueados

    Los atributos seleccionados se importarán como Bloqueados.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes ICU no pueden contener elementos en línea.

  • Importar entidades XML

    Las entidades XML en la Declaración DTD se importarán para su traducción.

  • Segmento XML

    Anular selección si no se desea segmentación.

  • Importar comentarios

    Los comentarios no se importan si los elementos se procesan como HTML, como se indica en la opción Elementos (procesados como HTML).

  • Convertir en etiquetas de Phrase TMS 

    Aplicar expresiones regulares para convertir texto especificado en etiquetas.

  • Convertir a entidades de carácteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como " , el carácter Σ se representaría como Σ usar Σ . & y < siempre se exportan como & y < respectivamente.

Configuración XML mediante XPath

El uso del idioma de consulta XPath permite crear reglas para importar complejas y algunas funciones adicionales no disponibles en las reglas simples para importar.

La expresión XPath debe definir los elementos y/o atributos cuyo texto/valor debe traducirse y no el nodo de texto real.

Se recomienda familiarizarse con XPath antes de usar.

No se procesarán nota de contexto, clave de contexto ni meta máxima para archivos de más de 10.000 elementos XML.

  • Clave de contexto

    Constituye el contexto TM (concordancias del 101%), si procede.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud meta máxima para cada elemento. El límite de caracteres para cada segmento se muestra en el panel de notas de contexto dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.

  • Dejar espacios en blanco

    Deje vacío para conservar los espacios en blanco en los elementos. Aplica xml:whitespace='preserve'. //* para preservar todos los espacios en blanco en todos los elementos, o usa una expresión XPath arbitraria.

Vista previa HTML con hoja de estilos XSLT

El idioma XSLT (transformaciones extensibles del idioma de la hoja de estilos) puede utilizarse para transformar documentos .XML a formato .HTML con fines de vista previa en contexto. Por consiguiente, los archivos vista previa descargados mediante traducción vista previa en el menú Documento vienen con extensión HTML. Actualmente Phrase es compatible con XSLT 2.0.

Haga clic en Seleccionar archivo para importar una hoja de estilo.

Haga clic en Descargar XSLT para descargar la hoja de estilo después de importar el archivo.

CDATA en archivo XML

CDATA significa Datos de caracteres y se define como bloques de texto que no son procesados por el analizador pero se reconocen como marca. Entidades predefinidas como <, > y & requieren mecanografía y generalmente son difíciles de leer en el marcado. En tales casos, se puede utilizar la sección CDATA.

Si CDATA contiene .HTML incrustado, los elementos XML correspondientes se deben enumerar en Elementos (procesados como HTML).

Si el archivo fuente contiene CDATA y se utiliza el segmento XML, se agrega CDATA a cada segmento del archivo terminado.

Los CDATA solo se segmentarán si hay una indicación borra de un salto de segmento como puntuación o espaciado.

Fuente:

<text><![CDATA[Texto traducible A. Texto traducible B.]]></text>

Meta:

<text><![CDATA[Texto traducible A.]]><![CDATA[ ]]><![CDATA[Texto traducible B.]]></text>

El archivo Completado es válido .XML y el visor XML mostrará el texto correctamente como texto traducible A. Texto traducible B.

Configuración específica de la aplicación

Wordpress XML

Configuración recomendada para WordPress XML:

  • XML

    XPath

  • Elementos y atributos

    //*[local-name()='encoded']|//description|//title

  • Elementos (procesados como HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en etiquetas Phrase

    (\[[^\]]++\])++

Seleccionar Conservar espacios en blanco en configuración HTML.

XML multilingüe

Los archivos multilingües se importan como varios trabajos bilingües con idiomas asignados antes de importar. Están representados con multilingual_xml.png en la tabla de trabajos. Si se importa a varios idiomas meta, el archivo terminado se compone de todos los idiomas meta.

Phrase admite archivos XML que tienen elementos fuente y meta presentes para todos los párrafos, incluso si la meta está vacía. Cuando las segmentaciones fuente y meta son diferentes, la segmentación fuente es determinante.

Todos los elementos de un mismo idioma deben ser descendientes del mismo elemento transunitario y un idioma no puede estar contenido dentro del otro. El contenido fuente y meta no se pueden almacenar en valores de atributo. Si varios elementos concordancia con XPath para fuente o meta dentro del elemento trans-unidad, solo se importa el primero para traducción.

  • Al crear un trabajo, seleccione XML multilingüe en el panel Tipo de archivo antes de aplicar Opciones de importación. Si no se especifica, el archivo se importará como .XML estándar.

  • El contenido de las etiquetas del archivo .XML fuente se puede visualizar en el editor haciendo clic en Ampliar etiquetas en el menú Herramientas y editar haciendo clic en F2.

Ejemplo:

Muestra de texto parcialmente traducido del inglés al alemán y al francés. Todos <tuv lang="en">, <tuv lang="de"> y <tuv lang="fr"> son hijos del mismo <tu> elemento.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Primer segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Segmento Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Segundo segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opciones de importación

Para importar archivos .XML multilingües debe utilizarse el idioma de consulta XPath. Ver ejemplo anterior como referencia. La expresión XPath define los elementos en los que debe traducirse el texto/valor y no el nodo de texto real.

  • Elementos que contienen sub-elementos fuente y meta

    //tu

  • Elementos que contienen texto fuente

    tuv[@lang='en']/seg (en relación con el elemento raíz //tu)

  • Elementos que contienen texto meta

    tuv[@lang='de']/seg (en relación con el elemento de alquiler de la nota de contexto pa //tu)

  • Elementos que contienen texto meta

    tuv[@lang='fr']/seg (en relación con el elemento raíz //tu)

  • Elementos en línea no traducibles

    Todos los elementos en fuente o meta se consideran elementos traducibles en línea, a menos que se especifiquen aquí como elementos no traducibles en línea.

  • Convertir en etiquetas de Phrase TMS 

    Aplicar expresiones regulares para convertir texto especificado en etiquetas.

  • Clave de contexto

    Especificar una clave de contexto que se guarde con el segmento en la memoria de traducción y se utilice para el contexto de concordancia.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima de texto meta

    Importar elementos o la longitud meta máxima para cada elemento

  • Convertir a entidades de carácteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como " , el carácter Σ se representaría como Σ usar Σ . & y < siempre se exportan como & y < respectivamente.

  • Analizar mensajes ICU

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes ICU no pueden contener elementos en línea.

  • Usar sub-filtro HTML 

    Importa etiquetas HTML contenidas en el archivo. Las etiquetas se pueden utilizar con configuración para importar archivos HTML. Las etiquetas de párrafo <p> crearán nuevos segmentos aunque el segmento XML multilingüe no esté seleccionado.

  • XML multilingüe de segmento

    El texto se segmenta mediante una regla de segmentación general en lugar de un segmento por celda.

    Precaución

    Aplicar XML multilingüe segmento a un archivo que contenga texto meta puede dar lugar a un número de segmentos en la fuente diferente al de la meta.

  • Cambiar el estado de segmento meta no vacío 

    Seleccionar estado predeterminado de confirmación y si los segmentos confirmados se agregan automáticamente a TM.

Ejemplo:

Si un .XML multilingüe contiene un espacio de nombres, el XPath podría ser el siguiente:

  • Elementos que contienen sub-elementos fuente y meta

    //*[local-name()='trans-unit']

  • Elementos que contienen texto fuente

    *[local-name()='source']

  • Elementos que contienen texto meta

    *[local-name()='target']

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.