Configuración de importación de archivos

.XML - lenguaje de marcado extensible (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

El formato de archivo .XML no está diseñado para traducción y requiere configuración adicional para una importación exitosa.

La configuración predeterminada está marcada con un asterisco (*) e importará todos los elementos XML para su traducción. Las opciones de importación se pueden utilizar para cambiar el comportamiento de importación.

Tipos de archivo

  • .XML

Opciones de importación

Normas de importación claras

  • Elementos

    Solo se importan los elementos seleccionados (nombre, título, párr. Un asterisco (*) importa todos los elementos.

  • Atributos

    Solo se importan los atributos seleccionados (nombre, título, párr. Un asterisco (*) importa todos los atributos.

  • Elementos traducibles en línea

    Si se selecciona la opción Identificar elementos automáticamente en línea, todos los elementos del texto traducible se importarán como elementos traducibles en línea.

  • Elementos no traducibles en línea

    El nombre, título, para de los elementos en línea seleccionados se convertirán en etiquetas y el contenido no será traducible.

  • Identifica los elementos en línea automáticamente

    Los elementos vecinos de los nodos de texto se convertirán automáticamente en etiquetas en línea.

  • Elementos (procesados como HTML)

    El código del elemento seleccionado se procesa como .HTML. La configuración de importación .HTML, como Conservar espacios en blanco o Saltar etiqueta (<br/>) crea un nuevo segmento, se puede utilizar para estos elementos.

  • Elementos bloqueados

    Los elementos seleccionados se importarán como Bloqueados.

  • Atributos bloqueados

    Los atributos seleccionados se importarán como Bloqueados.

  • Mensajes ICU analizados

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Importar entidades XML

    Las entidades XML de la Declaración DTD se importarán para su traducción.

  • Segmento XML

    Anular la selección si no se desea segmentación.

  • Importar comentarios

    Los comentarios no se importan si los elementos se procesan como HTML, como se indica en la opción Elementos (procesados como HTML).

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Convertir a entidades de caracteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como " , el carácter Σ se representaría como Σ uso " , Σ . & y < siempre se exportan como & y < respectivamente.

Configuración XML mediante XPath

El uso del idioma de consulta XPath permite la creación de reglas de importación complejas y algunas funciones adicionales no disponibles en las reglas de importación sin formato.

La expresión XPath debe definir los elementos y/o atributos cuyo texto/valor debe traducirse y no el nodo de texto real.

Se recomienda familiarizarse con XPath antes de usar.

Nota de contexto, clave de contexto y longitud máxima de texto meta no se procesarán para archivos de más de 10 000 elementos XML.

  • Clave de contexto

    Constituye el contexto de la TM (concordancias del 101%), si procede.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima meta

    Importar elementos o la longitud máxima de destino para cada elemento. El límite de caracteres para cada segmento se muestra en el panel de Nota de contexto dentro del editor. Cualquier carácter que exceda el límite se resalta en rojo.

  • Conservar espacios en blanco

    Dejar en blanco para conservar los espacios en blanco en los elementos. Aplica xml:whitespace='preserve'. //* para conservar todos los espacios en blanco en todos los elementos, o usa una expresión XPath arbitraria.

Vista previa en HTML con la hoja de estilos XSLT

El idioma XSLT (Extensible Stylesheet Language Transformations) se puede utilizar para transformar documentos .XML en formato .HTML con fines de vista previa en contexto. Por consiguiente, los archivos de vista previa descargados a través de la traducción de vista previa en el menú Documento vienen con extensión HTML. Phrase actualmente es compatible con XSLT 2.0.

Haga clic en Seleccionar archivo para importar una hoja de estilo.

Haga clic en Descargar XSLT para descargar la hoja de estilo después de importar el archivo.

CDATA en el archivo XML

CDATA significa Datos de Caracteres y se define como bloques de texto que no son procesados por el analizador pero que se reconocen como marcas. Entidades predefinidas como <, > y & requieren mecanografía y, por lo general, son difíciles de leer en el margen. En tales casos, se puede utilizar la sección CDATA.

Si CDATA contiene .HTML incrustado, los elementos XML correspondientes se deben enumerar en Elementos (procesados como HTML).

Si el archivo fuente contiene CDATA y se utiliza el Segmento XML, se agrega CDATA a cada segmento del archivo Completado.

Los CDATA solo se segmentarán si hay una indicación clara de un salto de segmento, como puntuación o espaciado.

Fuente:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Meta:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

El archivo Completed es válido .XML y el visor XML mostrará el texto correctamente como Texto traducible A. Texto traducible B.

Configuración específica de la aplicación

Wordpress XML

Configuración recomendada para Wordpress XML:

  • XML

    XPath

  • Elementos y atributos

    //*[local-name()='encoded']|//description|//title

  • Elementos (procesados como HTML)

    //*[local-name()='encoded']|//description|//title

  • Convertir en etiquetas Phrase

    (\[[^\]]++\])++

Seleccione Conservar espacios en blanco en Configuración HTML.

XML multilingüe

Los archivos multilingües se importan como varios trabajos bilingües con idiomas asignados antes de la importación. Están representados con multilingual_xml.png en la tabla de trabajos. Si se importa a varios idiomas meta, el archivo Terminado se compone de todos los idiomas meta.

Phrase admite archivos XML que tienen elementos fuente y meta presentes en todos los párrafos, incluso si la meta está vacía. Cuando la segmentación fuente y meta son diferentes, la segmentación fuente es determinante.

Todos los elementos lingüísticos individuales deben ser descendientes del mismo elemento transunitario y una lengua no puede estar contenida dentro de la otra. El contenido fuente y meta no se pueden almacenar en valores de atributo. Si varios elementos coinciden con el XPath para texto fuente o meta dentro del elemento de la unidad trans, solo se importa el primero para traducción.

  • Al crear un trabajo, seleccione XML multilingüe en el panel Tipo de archivo antes de aplicar Opciones de importación. Si no se especifica, el archivo se importará como .XML estándar.

  • El contenido de las etiquetas del archivo .XML fuente se puede visualizar en el editor haciendo clic en Ampliar etiquetas en el menú Herramientas y editar haciendo clic en F2.

Ejemplo:

Muestra de texto parcialmente traducido del inglés al alemán y al francés. Todos <tuv lang="en">, <tuv lang="de"> y <tuv lang="fr"> son hijos del mismo elemento <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto no traducible.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Primer segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Segmento Erste</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Segundo segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opciones de importación

Para la importación de archivos .XML multilingües debe utilizarse el idioma de consulta XPath. Ver ejemplo anterior para referencia. La expresión XPath define los elementos en los que debe traducirse el texto/valor y no el nodo de texto real.

  • Elementos que contienen sub-elementos fuente y meta

    //tu

  • Elementos que contienen texto fuente

    tuv[@lang='en']/seg (en relación con el elemento raíz //tu)

  • Elementos que contienen texto meta

    tuv[@lang='de']/seg (en relación con el elemento de alquiler paNota de contexto //tu)

  • Elementos que contienen texto meta

    tuv[@lang='fr']/seg (en relación con el elemento raíz //tu)

  • Elementos no traducibles en línea

    Todos los elementos en texto fuente o meta se consideran elementos traducibles en línea a menos que se especifiquen aquí como elementos no traducibles en línea.

  • Convertir en etiquetas de Phrase TMS 

    Aplica expresiones regulares para convertir el texto especificado en etiquetas.

  • Clave de contexto

    Especifica una clave de contexto que se guarda con el segmento en la memoria de traducción y se usa para concordar con el contexto.

  • Nota de contexto

    Importar elementos o atributos de contexto para cada elemento.

  • Longitud máxima meta

    Importar elementos o la longitud máxima de destino para cada elemento

  • Convertir a entidades de caracteres

    Introduzca una lista de referencias de caracteres (separadas por comas) en el archivo de salida.

    Ejemplo:

    Si se requieren comillas ("), se representarían como " , el carácter Σ se representaría como Σ uso " , Σ . & y < siempre se exportan como & y < respectivamente.

  • Mensajes ICU analizados

    Los mensajes ICU se convierten automáticamente en etiquetas. Los archivos con mensajes UCI no pueden contener elementos en línea.

  • Utilizar subfiltro HTML 

    Importa etiquetas HTML contenidas en el archivo. Las etiquetas se pueden utilizar con la configuración de importación de archivos HTML. Las etiquetas de párrafo <p> crearán nuevos segmentos incluso si el segmento XML multilingüe no está seleccionado.

  • XML multilingüe de segmento

    El texto está segmentado por una regla de segmentación general en lugar de un segmento por celda.

    Precaución

    Aplicar XML multilingüe de segmento a un archivo que contiene texto meta puede dar lugar a un número diferente de segmentos en el texto fuente que en el meta.

  • Establecer el estatus del segmento del texto meta no vacío 

    Seleccione el estado de confirmación predeterminado y si los segmentos confirmados se agregan automáticamente a la TM.

Ejemplo:

Si un .XML multilingüe contiene un espacio de nombres, el XPath podría ser el siguiente:

  • Elementos que contienen sub-elementos fuente y meta

    //*[local-name()='trans-unit']

  • Elementos que contienen texto fuente

    *[local-name()='source']

  • Elementos que contienen texto meta

    *[local-name()='target']

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.