O formato de arquivo .XML não foi projetado para tradução e requer configurações adicionais para uma importação bem-sucedida.
As configurações padrão são marcadas com um asterisco (*) e importarão todos os elementos XML para tradução. As opções de importação podem ser usadas para alterar o comportamento de importação.
Os chatbots de IA podem ser muito eficazes na identificação de problemas de formato em arquivos baseados em .XML.
Tipos de arquivo
-
.XML
Opções de importação
Regras de importação simples
-
Somente os elementos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco ( ) importa todos os elementos.
-
Somente os atributos selecionados (ou seja, nome, título, parágrafo) são importados. Um asterisco ( ) importa todos os atributos.
-
Se o Traduzível em linha Elementos.
estiver selecionada, todos os elementos no texto traduzível serão importados como -
Elemento embutido selecionado nome, título, parágrafo serão convertidos em tags e o conteúdo não será traduzível.
-
Os elementos vizinhos dos nós de texto serão convertidos automaticamente em tags embutidas.
-
O código do elemento selecionado é processado como .HTML. .HTML configurações de importação, como Preservar espaços em branco ou Tag de quebra (<br/>) cria um novo segmento pode ser usado para esses elementos.
Use essa opção quando o valor do elemento selecionado contiver .HTML marcação. Ela não se aplica a filhos do elemento selecionado, a menos que especificado de outra forma.
-
Os elementos selecionados serão importados como Trancado.
-
Os atributos selecionados serão importados como Trancado.
-
As mensagens ICU são convertidas automaticamente em tags. Os arquivos com mensagens ICU não podem conter nenhum elemento embutido.
-
Entidades XML em Declaração DTD será importado para tradução.
-
Desmarque se a segmentação não for desejada.
-
Os comentários não são importados se os elementos forem processados como HTML, conforme indicado no Elementos (processados como HTML) opção.
-
Aplicar expressões regulares para converter texto especificado em tags.
-
Insira uma lista de referências de caracteres (separadas por vírgulas) no arquivo de saída.
Exemplo:
Configurações XML usando XPath
Usando o XPath A linguagem de consulta permite a criação de regras de importação complexas e alguns recursos adicionais indisponíveis em regras de importação simples.
A expressão XPath deve definir os elementos e/ou atributos cujo texto/valor deve ser traduzido e não o nó de texto real.
Recomenda-se familiaridade com o XPath antes de usar.
, e não serão processados para arquivos com mais de 10.000 elementos XML.
-
Constitui contexto de TM (101% de correspondências), se aplicável.
-
Importe elementos ou atributos de contexto para cada elemento.
-
Importe elementos ou o comprimento máximo do alvo para cada elemento. O limite de caracteres para cada segmento é exibido no dentro do editor. Qualquer caractere que exceda o limite é destacado em vermelho.
-
Mantenha vazio para preservar espaços em branco nos elementos. Aplicar xml:whitespace='preservar'. //* para preservar todos os espaços em branco em todos os elementos ou usar uma expressão XPath arbitrária.
Visualização HTML com folha de estilo XSLT
A linguagem XSLT (Extensible Stylesheet Language Transformations) pode ser usada para transformar documentos .XML em formato .HTML para Visualização no contexto Fins. Assim, visualize os arquivos baixados via Visualizar tradução No Documento vêm com extensão HTML. Atualmente, o Phrase oferece suporte ao XSLT 2.0.
Clique Escolher arquivo para importar uma folha de estilo.
Clique Baixar XSLT para baixar a folha de estilo após a importação do arquivo.
CDATA no arquivo XML
CDATA significa Dados de Caractere e é definido como blocos de texto que não são processados pelo analisador, mas são reconhecidos como marcação. Entidades predefinidas, como <,
>
e &
exigem digitação e geralmente são difíceis de ler na marcação. Nesses casos, a seção CDATA pode ser usada.
Se CDATA contiver .HTML incorporado, os elementos XML correspondentes deverão ser listados em
.Se o arquivo de origem contiver CDATA e o
for usado, CDATA será adicionado a cada segmento no arquivo Concluído.O CDATA só será segmentado se houver uma indicação clara de uma quebra de segmento, como pontuação ou espaçamento.
Fonte:
<text><![CDATA[Translatable text A. Translatable text B.]]></text>
Alvo:
<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>
O arquivo Concluído é válido .XML e o visualizador XML exibirá o texto corretamente como Texto traduzível A. Texto traduzível B.
Os arquivos multilíngues são importados como vários trabalhos bilíngues com idiomas mapeados antes da importação. Eles são representados com No Empregos mesa. Se importado para vários idiomas de destino, o Concluído é composto por todos os idiomas de destino.
O Phrase oferece suporte a arquivos XML que têm elementos de origem e destino presentes para todos os parágrafos, mesmo que o destino esteja vazio. Quando a segmentação de origem e de destino são diferentes, a segmentação de origem é determinante.
Os elementos linguísticos individuais devem ser todos descendentes do mesmo elemento transunitário e um idioma não pode estar contido no outro. O conteúdo de origem e de destino não pode ser armazenado em valores de atributo. Se vários elementos corresponderem ao XPath para origem ou destino dentro do elemento transunidade, somente o primeiro será importado para tradução.
-
Ao criar um trabalhoselecionar do antes de aplicar as Opções de Importação. Se não for especificado, o arquivo será importado como .XML padrão.
-
O conteúdo da tag do arquivo .XML de origem pode ser visualizado no editor clicando em Expandir tags sob o e editado clicando em F2.
Exemplo:
Amostra de texto parcialmente traduzido do inglês para o alemão e francês. Todo <tuv lang="en">
, <tuv lang="de">
e <tuv lang="fr">
são filhos do mesmo <tu>
elemento.</tu></tuv></tuv></tuv>
<?xml version="1.0" encoding="utf-8"?> <root> Texto não traduzível. <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>Primeiro segmento.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="another context note" key="ID 255" maxlen="18"> <tuv lang="en"> <seg>Segundo segmento.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Opções de importação
Para a importação de arquivos .XML multilíngues, o XPath linguagem de consulta deve ser usada. Veja o exemplo acima para referência. A expressão XPath define os elementos nos quais o texto/valor deve ser traduzido e não o nó de texto real.
-
//tu
-
tuv[@lang='en']/seg
(em relação ao elemento paivocê
) -
tuv[@lang='de']/seg
(em relação ao PA elemento de aluguelvocê
) -
tuv[@lang='fr']/seg
(em relação ao elemento paivocê
) -
Todos os elementos na origem ou no destino são considerados elementos embutidos traduzíveis, a menos que especificados aqui como elementos embutidos não traduzíveis.
-
Aplicar expressões regulares para converter texto especificado em tags.
-
Especifique uma chave de contexto que é salva com o segmento no Memória de tradução e usado para contexto de correspondência.
-
Importe elementos ou atributos de contexto para cada elemento.
-
Importar elementos ou o comprimento máximo de destino para cada elemento
-
Insira uma lista de referências de caracteres (separadas por vírgulas) no arquivo de saída.
Exemplo:
-
As mensagens ICU são convertidas automaticamente em tags. Os arquivos com mensagens ICU não podem conter nenhum elemento embutido.
-
Importa tags HTML contidas no arquivo. As tags podem ser usadas com as configurações de importação de arquivos HTML. Tags de parágrafo
<p>
criará novos segmentos mesmo que está desmarcada. -
O texto é segmentado por um Regra de segmentação em vez de um segmento por célula.
Cuidado
Aplicação
a um arquivo que contém texto de destino pode resultar em um número diferente de segmentos na origem e no destino. -
Selecione o status de confirmação padrão e se os segmentos confirmados são adicionados automaticamente ao TM.
Exemplo: