O formato do arquivo .XML não é projetado para tradução e requer configurações adicionais para uma importação bem-sucedida.
As configurações padrão são marcadas com um asterisco (*) e importarão todos os elementos XML para tradução. As opções de importação podem ser usadas para alterar o comportamento da importação.
Os serviços de IA podem ser muito eficazes na identificação de problemas de formato em arquivos baseados em .XML.
Tipos de arquivo
-
.XML
Opções de importar
Regras de importação simples
-
Apenas elementos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco ( ) importa todos os elementos.
-
Apenas atributos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco ( ) importa todos os atributos.
-
Se a opção Traduzíveis em linha.
estiver selecionada, todos os elementos no texto traduzível serão importados como elementos -
O elemento em linha selecionado nome, título, parágrafo será convertido em tags e o conteúdo não será traduzível.
Importante
Problemas com tags são uma causa comum de erros de exportação (por exemplo, ), especialmente para tipos de arquivo como planilhas (baseadas em MS Excel) e .XML. Sempre verifique se as tags e a formatação estão corretas antes de exportar arquivos, realizando verificações de controle de qualidade.
-
Elementos que são vizinhos de nós de texto serão automaticamente convertidos em tags em linha.
-
O código do elemento selecionado é processado como .HTML. As configurações de importação .HTML como Preservar espaços em branco ou Quebra de tag (<br/>) cria novo segmento podem ser usadas para esses elementos.
Use esta opção quando o valor do elemento selecionado contiver marcação .HTML. Não se aplica a filhos do elemento selecionado, a menos que especificado de outra forma.
-
Os elementos selecionados serão importados como Bloqueado.
-
Os atributos selecionados serão importados como Bloqueado.
-
As mensagens ICU são convertidas automaticamente em tags. Arquivos com mensagens ICU não podem conter nenhum elemento em linha.
-
Entidades XML em Declaração DTD serão importadas para tradução.
-
Desmarque se a segmentação não for desejada.
-
Comentários não são importados se os elementos forem processados como HTML, conforme indicado na opção Elementos (processados como HTML).
-
Aplicar expressões regulares para converter texto especificado em tags.
-
Insira uma lista de referências de caractere (separadas por vírgulas) no arquivo de saída.
Exemplo:
Configurações XML usando XPath
Usar a linguagem de consulta XPath permite a criação de regras de importação complexas e alguns recursos adicionais não disponíveis em regras de importação simples.
A expressão XPath deve definir os elementos e/ou atributos cujo texto/valor deve ser traduzido e não o nó de texto real.
Familiaridade com XPath é recomendada antes de usar.
, , e não serão processados para arquivos com mais de 10.000 elementos XML.
-
Constitui contexto de memória de tradução (101% de correspondência) se aplicável.
-
Importar elementos ou atributos de contexto para cada elemento.
-
Importar elementos ou o comprimento máximo de tradução para cada elemento. O limite de caracteres para cada segmento é exibido no painel dentro do editor. Qualquer caractere que exceda o limite é destacado em vermelho.
-
Mantenha vazio para preservar espaços em branco nos elementos. Aplique xml:whitespace='preserve'. //* para preservar todos os espaços em branco em todos os elementos, ou use uma expressão XPath arbitrária.
Prévia HTML com folha de estilo XSLT
A linguagem XSLT (Transformações de Linguagem de Folha de Estilo Extensível) pode ser usada para transformar documentos .XML em formato .HTML para fins de prévia em contexto. Consequentemente, arquivos de prévia baixados via Prévia de tradução no menu Documento vêm com extensão HTML. A frase atualmente suporta XSLT 2.0.
XSLT usado para prévia deve ser baseado no alvo, não na fonte.
Clique Escolher arquivo para importar uma folha de estilo.
Clique Baixar XSLT para baixar a folha de estilo após a importação do arquivo.
CDATA em arquivo XML
CDATA significa Dados de Caractere e é definido como blocos de texto que não são processados pelo analisador, mas são reconhecidos como marcação. Entidades predefinidas como <,
>
, e &
requerem digitação e geralmente são difíceis de ler na marcação. Em tais casos, a seção CDATA pode ser usada.
Se o CDATA contiver .HTML embutido, os elementos XML correspondentes devem ser listados sob
.Se o arquivo de origem contiver CDATA e o
for usado, então o CDATA é adicionado a cada segmento no arquivo Completo.CDATA só será segmentado se houver uma indicação clara de uma quebra de segmento, como pontuação ou espaçamento.
Fonte:
<text><![CDATA[Texto traduzível A. Texto traduzível B.]]></text>
Alvo:
<text><![CDATA[Texto traduzível A.]]><![CDATA[ ]]><![CDATA[Texto traduzível B.]]></text>
O arquivo Completo é um .XML válido e o visualizador XML exibirá o texto corretamente como Texto traduzível A. Texto traduzível B.
Arquivos multilíngues são importados como múltiplos trabalhos bilíngues com idiomas mapeados antes da importação. Eles são representados com na tabela trabalhos. Se importado para vários idiomas-alvo, o Completo é composto por todos os idiomas-alvo.
A frase suporta arquivos XML que possuem elementos de origem e destino presentes para todos os parágrafos, mesmo que o destino esteja vazio. Quando a segmentação de origem e destino é diferente, a segmentação de origem é determinante.
Os elementos de idioma individuais devem ser todos descendentes do mesmo elemento trans-unit e um idioma não pode estar contido dentro do outro. O conteúdo de origem e destino não pode ser armazenado em valores de atributo. Se vários elementos corresponderem ao XPath para origem ou destino dentro do elemento trans-unit, apenas o primeiro será importado para tradução.
-
Ao criar um trabalho, selecione no painel antes de aplicar as Opções de Importação. Se não especificado, o arquivo será importado como padrão .XML.
-
O conteúdo da tag do arquivo .XML de origem pode ser visualizado no editor clicando em Expandir tags no menu e editado clicando em F2.
Exemplo:
Amostra de texto parcialmente traduzido do inglês para o alemão e francês. Todos <tuv lang="pt">
, <tuv lang="de">
e <tuv lang="fr">
são filhos do mesmo elemento <tu>
.
<?xml version="1.0" encoding="utf-8"?> <root> Texto não traduzível. <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>Primeiro segmento.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu nota="outra nota de contexto" chave="ID 255" maxlen="18"> <tuv lang="en"> <seg>Segundo segmento.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Opções de importar
Para a importação de arquivos .XML multilíngues, a linguagem de consulta XPath deve ser utilizada. Veja o exemplo acima para referência. A expressão XPath define os elementos nos quais o texto/valor deve ser traduzido e não o nó de texto real.
-
//tu
-
tuv[@lang='en']/seg
(em relação ao elemento pai//tu
) -
tuv[@lang='de']/seg
(em relação ao pa elemento//tu
) -
tuv[@lang='fr']/seg
(em relação ao elemento pai//tu
) -
Todos os elementos em fonte ou destino são considerados elementos inline traduzíveis, a menos que especificado aqui como elementos inline não traduzíveis.
-
Aplicar expressões regulares para converter texto especificado em tags.
-
Especifique uma chave de contexto que é salva com o segmento na memória de tradução e usada para o contexto de correspondência.
-
Importar elementos ou atributos de contexto para cada elemento.
-
Importar elementos ou o comprimento máximo do destino para cada elemento
-
Insira uma lista de referências de caractere (separadas por vírgulas) no arquivo de saída.
Exemplo:
-
As mensagens ICU são convertidas automaticamente em tags. Arquivos com mensagens ICU não podem conter nenhum elemento em linha.
-
Importará tags HTML contidos no arquivo. Tags podem ser usadas com as Configurações de Importação de Arquivo HTML. Tags de parágrafo
<p>
criarão novos segmentos mesmo que não esteja selecionado. -
O texto é segmentado por uma regra de segmentação geral em vez de um segmento por célula.
Cuidado
Aplicar
a um arquivo que contém texto de destino pode resultar em um número diferente de segmentos na fonte do que no destino. -
Selecione o status de confirmação padrão e se os segmentos confirmados são adicionados automaticamente à TM.
Exemplo: