Configurações de importação de arquivo

.XML - Extensible Markup Language (TMS)

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

O formato do arquivo .XML não é projetado para tradução e requer configurações adicionais para uma importação bem-sucedida.

As configurações padrão são marcadas com um asterisco (*) e importarão todos os elementos XML para tradução. As opções de importação podem ser usadas para alterar o comportamento da importação.

Os serviços de IA podem ser muito eficazes na identificação de problemas de formato em arquivos baseados em .XML.

Tipos de arquivo

  • .XML

Opções de importar

Regras de importação simples

  • Elementos

    Apenas elementos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco (*) importa todos os elementos.

  • Atributos

    Apenas atributos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco (*) importa todos os atributos.

  • Elementos em linha traduzíveis

    Se a opção Identificar elementos em linha automaticamente estiver selecionada, todos os elementos no texto traduzível serão importados como elementos Traduzíveis em linha.

  • Elementos em linha não traduzíveis

    O elemento em linha selecionado nome, título, parágrafo será convertido em tags e o conteúdo não será traduzível.

    Importante

    Problemas com tags são uma causa comum de erros de exportação (por exemplo, O arquivo não pôde ser gerado), especialmente para tipos de arquivo como planilhas (baseadas em MS Excel) e .XML. Sempre verifique se as tags e a formatação estão corretas antes de exportar arquivos, realizando verificações de controle de qualidade.

  • Identificar elementos em linha automaticamente

    Elementos que são vizinhos de nós de texto serão automaticamente convertidos em tags em linha.

  • Elementos (processados como HTML)

    O código do elemento selecionado é processado como .HTML. As configurações de importação .HTML como Preservar espaços em branco ou Quebra de tag (<br/>) cria novo segmento podem ser usadas para esses elementos.

    Use esta opção quando o valor do elemento selecionado contiver marcação .HTML. Não se aplica a filhos do elemento selecionado, a menos que especificado de outra forma.

  • Elementos bloqueados

    Os elementos selecionados serão importados como Bloqueado.

  • Atributos bloqueados

    Os atributos selecionados serão importados como Bloqueado.

  • Analisar mensagens ICU

    As mensagens ICU são convertidas automaticamente em tags. Arquivos com mensagens ICU não podem conter nenhum elemento em linha.

  • Importar entidades XML

    Entidades XML em Declaração DTD serão importadas para tradução.

  • Segmentar XML

    Desmarque se a segmentação não for desejada.

  • Importar comentários

    Comentários não são importados se os elementos forem processados como HTML, conforme indicado na opção Elementos (processados como HTML).

  • Converter em códigos do Phrase TMS 

    Aplicar expressões regulares para converter texto especificado em tags.

  • Converter em entidades de caracteres

    Insira uma lista de referências de caractere (separadas por vírgulas) no arquivo de saída.

    Exemplo:

    Se aspas (") forem necessárias, elas seriam representadas como &quot;, o caractere Σ seria representado como &#x3A3; use &quot;,&#x3A3;. & e < são sempre exportados como &amp; e &lt; respectivamente.

Configurações XML usando XPath

Usar a linguagem de consulta XPath permite a criação de regras de importação complexas e alguns recursos adicionais não disponíveis em regras de importação simples.

A expressão XPath deve definir os elementos e/ou atributos cujo texto/valor deve ser traduzido e não o nó de texto real.

Familiaridade com XPath é recomendada antes de usar.

Nota de contexto, Chave de contexto, e Comprimento máximo do alvo não serão processados para arquivos com mais de 10.000 elementos XML.

  • Chave de contexto

    Constitui contexto de memória de tradução (101% de correspondência) se aplicável.

  • Nota de contexto

    Importar elementos ou atributos de contexto para cada elemento.

  • Comprimento máx. da tradução

    Importar elementos ou o comprimento máximo de tradução para cada elemento. O limite de caracteres para cada segmento é exibido no painel nota de contexto dentro do editor. Qualquer caractere que exceda o limite é destacado em vermelho.

  • Manter os espaços em branco

    Mantenha vazio para preservar espaços em branco nos elementos. Aplique xml:whitespace='preserve'. //* para preservar todos os espaços em branco em todos os elementos, ou use uma expressão XPath arbitrária.

Prévia HTML com folha de estilo XSLT

A linguagem XSLT (Transformações de Linguagem de Folha de Estilo Extensível) pode ser usada para transformar documentos .XML em formato .HTML para fins de prévia em contexto. Consequentemente, arquivos de prévia baixados via Prévia de tradução no menu Documento vêm com extensão HTML. A frase atualmente suporta XSLT 2.0.

XSLT usado para prévia deve ser baseado no alvo, não na fonte.

Clique Escolher arquivo para importar uma folha de estilo.

Clique Baixar XSLT para baixar a folha de estilo após a importação do arquivo.

CDATA em arquivo XML

CDATA significa Dados de Caractere e é definido como blocos de texto que não são processados pelo analisador, mas são reconhecidos como marcação. Entidades predefinidas como &lt;, &gt;, e &amp; requerem digitação e geralmente são difíceis de ler na marcação. Em tais casos, a seção CDATA pode ser usada.

Se o CDATA contiver .HTML embutido, os elementos XML correspondentes devem ser listados sob Elementos (processados como HTML).

Se o arquivo de origem contiver CDATA e o Segmento XML for usado, então o CDATA é adicionado a cada segmento no arquivo Completo.

CDATA só será segmentado se houver uma indicação clara de uma quebra de segmento, como pontuação ou espaçamento.

Fonte:

<text><![CDATA[Texto traduzível A. Texto traduzível B.]]></text>

Alvo:

<text><![CDATA[Texto traduzível A.]]><![CDATA[ ]]><![CDATA[Texto traduzível B.]]></text>

O arquivo Completo é um .XML válido e o visualizador XML exibirá o texto corretamente como Texto traduzível A. Texto traduzível B.

Configurações Específicas do Aplicativo

Wordpress XML

Configurações recomendadas para Wordpress XML:

  • XML

    XPath

  • Elementos e atributos

    //*[local-name()='encoded']|//description|//title

  • Elementos (processados como HTML)

    //*[local-name()='encoded']|//description|//title

  • Converter em códigos do Phrase

    (\[[^\]]++\])++

Selecione Preservar espaços em branco nas configurações HTML.

XML Multilíngue

Arquivos multilíngues são importados como múltiplos trabalhos bilíngues com idiomas mapeados antes da importação. Eles são representados com multilingual_xml.png na tabela trabalhos. Se importado para vários idiomas-alvo, o Completo é composto por todos os idiomas-alvo.

A frase suporta arquivos XML que possuem elementos de origem e destino presentes para todos os parágrafos, mesmo que o destino esteja vazio. Quando a segmentação de origem e destino é diferente, a segmentação de origem é determinante.

Os elementos de idioma individuais devem ser todos descendentes do mesmo elemento trans-unit e um idioma não pode estar contido dentro do outro. O conteúdo de origem e destino não pode ser armazenado em valores de atributo. Se vários elementos corresponderem ao XPath para origem ou destino dentro do elemento trans-unit, apenas o primeiro será importado para tradução.

  • Ao criar um trabalho, selecione XML Multilíngue no painel Tipo de Arquivo antes de aplicar as Opções de Importação. Se não especificado, o arquivo será importado como padrão .XML.

  • O conteúdo da tag do arquivo .XML de origem pode ser visualizado no editor clicando em Expandir tags no menu Ferramenta e editado clicando em F2.

Exemplo:

Amostra de texto parcialmente traduzido do inglês para o alemão e francês. Todos <tuv lang="pt">, <tuv lang="de"> e <tuv lang="fr"> são filhos do mesmo elemento <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Texto não traduzível.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>Primeiro segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu nota="outra nota de contexto" chave="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Segundo segmento.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Opções de importar

Para a importação de arquivos .XML multilíngues, a linguagem de consulta XPath deve ser utilizada. Veja o exemplo acima para referência. A expressão XPath define os elementos nos quais o texto/valor deve ser traduzido e não o nó de texto real.

  • Elementos que contêm subelementos do original e da tradução

    //tu

  • Elementos que contêm texto do original

    tuv[@lang='en']/seg (em relação ao elemento pai //tu)

  • Elementos que contêm texto da tradução

    tuv[@lang='de']/seg (em relação ao panota de contexto elemento //tu)

  • Elementos que contêm texto da tradução

    tuv[@lang='fr']/seg (em relação ao elemento pai //tu)

  • Elementos em linha não traduzíveis

    Todos os elementos em fonte ou destino são considerados elementos inline traduzíveis, a menos que especificado aqui como elementos inline não traduzíveis.

  • Converter em códigos do Phrase TMS 

    Aplicar expressões regulares para converter texto especificado em tags.

  • Chave de contexto

    Especifique uma chave de contexto que é salva com o segmento na memória de tradução e usada para o contexto de correspondência.

  • nota de contexto

    Importar elementos ou atributos de contexto para cada elemento.

  • Comprimento máx. da tradução

    Importar elementos ou o comprimento máximo do destino para cada elemento

  • Converter em entidades de caracteres

    Insira uma lista de referências de caractere (separadas por vírgulas) no arquivo de saída.

    Exemplo:

    Se aspas (") forem necessárias, elas seriam representadas como &quot;, o caractere Σ seria representado como &#x3A3; use &quot;,&#x3A3;. & e < são sempre exportados como &amp; e &lt; respectivamente.

  • Analisar mensagens ICU

    As mensagens ICU são convertidas automaticamente em tags. Arquivos com mensagens ICU não podem conter nenhum elemento em linha.

  • Usar subfiltro de HTML 

    Importará tags HTML contidos no arquivo. Tags podem ser usadas com as Configurações de Importação de Arquivo HTML. Tags de parágrafo <p> criarão novos segmentos mesmo que Segmentar XML multilíngue não esteja selecionado.

  • Segmentar XML multilíngue

    O texto é segmentado por uma regra de segmentação geral em vez de um segmento por célula.

    Cuidado

    Aplicar Segmentar XML multilíngue a um arquivo que contém texto de destino pode resultar em um número diferente de segmentos na fonte do que no destino.

  • Definir estado de segmento com tradução não vazia 

    Selecione o status de confirmação padrão e se os segmentos confirmados são adicionados automaticamente à TM.

Exemplo:

Se um .XML multilíngue contém namespace, o XPath pode ser o seguinte:

  • Elementos que contêm subelementos do original e da tradução

    //*[local-name()='trans-unit']

  • Elementos que contêm texto do original

    *[local-name()='source']

  • Elementos que contêm texto da tradução

    *[local-name()='tradução']

Esse artigo foi útil?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.