Segmentação É a divisão de textos originais em partes menores. Isso melhora a recuperação de texto já traduzido a partir de uma memória de tradução. Os segmentos são apresentados no editor e podem ser filtrados.
As regras padrão de segmentação correspondem aos detalhes de cada idioma aceito e podem ser personalizadas.
Trabalhos importados com segmentação ruim, como arquivos de documentos com mal formato ou a aplicação de personalização de segmentação inadequada, podem afetar os valores de correspondência da memória de tradução.
Exemplo:
Boa segmentação:
-
As memórias de tradução com idiomas de tradução multilíngues são compatíveis e podem ser usadas de forma bidirecional.
Valor de correspondência de 100%.
Segmentação ruim
-
Existem memórias de tradução com idiomas de tradução multilíngues.
Valor de correspondência de 100%.
-
e pode ser usado de forma bidirecional.
Valor de correspondência de 63%.
Regras de segmentação personalizadas podem ser aplicadas a trabalhos e projetos. Se um projeto exigir uma regra de segmentação personalizada, um modelo será necessário criar para esse projeto. Quando definidos como primários, regras de segmentação personalizadas são aplicadas a todos os novos trabalhos importados para esse idioma de texto original.
Existem dois tipos de regras de segmentação:
-
Abreviações para o arquivo .XLSX
-
Expressão regular de arquivos .SRX
Para usar regras personalizadas, baixe as regras padrão, modifique-as, upload o arquivo modificado e depois aplique-as aos trabalhos especificados.
Atenção
Ao adicionar regras de segmentação personalizado para um idioma de texto original do CJK sem espaço (quando um idioma de tradução usará espaços como delimitador de palavras), certifique-se de que os espaços no início ou no fim do segmento de tradução são adicionados aos segmentos dividir pela regra personalizado; isso delimita palavras na tradução. Embora isso ocorra automaticamente em segmentos formados por regras padrão de segmentação, nenhum espaço é adicionado em segmentos divididos manualmente ou que são formados por regras adicionais de segmentação personalizadas.
Para baixar as regras padrão de segmentação, siga estes passos:
-
Na página Configurações
role para baixo até a seção e clique em Segmentação.
A página
é aberta. -
Selecione o idioma para personalizar e clique em Exportar XLSX/SRX.
A janela
é aberta. -
Selecionar formato:
-
O XLSX fornece uma lista de abreviações.
-
O SRX fornece regras expressão regulares.
-
-
Selecione um idioma da lista suspensa.
-
Clique Baixar.
O arquivo foi baixado para o seu sistema.
Para baixar uma regra de segmentação carregada anteriormente que você fez upload anteriormente, execute estas etapas:
-
Na página Configurações
role para baixo até a seção e clique em Segmentação.
A página
é aberta. -
Clique no ícone configurações à direita e escolha personalizar colunas:
-
Ativar a coluna Nome de arquivo
-
Clique em um nome de arquivo para baixar uma regra pré-gravada.
As abreviações podem ser especificadas para idiomas individuais após os quais novos segmentos não devem ser criados.
Para editar abreviações, siga estes passos:
-
Abra o arquivo .XLSX baixado em um editor.
-
Altere o conteúdo com a seguinte formatação:
O arquivo XLSX deve ter duas colunas sem cabeçalhos.
-
Coluna 1: Abreviação a ser especificada
-
Coluna 2: Especificação do comportamento de segmentação
-
ABBR_UPPER_NUM
Um novo segmento não será criado se a abreviação for seguida de espaço branco e, em seguida, de um número, um símbolo (matema, sinais de moeda, sinalizadores, etc.) ou uma palavra com a primeira letra no caso superior.
-
ABBR_NUM
Um novo segmento não será criado se a abreviação for seguida por espaço em branco e, em seguida, por um número.
-
-
-
Gravar o arquivo .XLSX editado.
A edição de arquivos .SRX é um processo complexo adequado apenas para usuários experientes no uso de expressões regulares
Existem várias regras que podem ser alteradas em um arquivo SRX:
-
Importar texto de um arquivo XLSX sem segmentação; uma célula é igual a um segmento.
-
Importe texto com uma nova linha do pedido para dividir um segmento em dois.
-
Use um colon (ou qualquer outro caractere) como um separador de segmento.
-
Proibir o usar de um semicolão (ou qualquer outro caractere) como um separador de segmento.
-
Removendo uma abreviação da lista (o texto será segmentado).
Essas regras são caracteres; apenas um único caractere pode ser usado como separador de segmento. Aos grupos de caracteres (por exemplo: <p>) não é possível usar como separador de segmento.
Para editar um arquivo SRX, siga estes passos:
-
Abra o arquivo em um editor de texto como Notepad ++.
-
Edite usando expressões regulares ou remova completamente a segmentação interna.
Exemplo:
-
<rule break="no">
A lista de regras onde o segmento não será quebrado. Ou seja, uma lista de abreviações
-
<regra> <beforebreak>
Uma expressão regular para um caractere antes de uma quebra (por exemplo, no final de uma sentença ". ? :"). Se você, por exemplo, não quiser segmentar texto após um colo, simplesmente exclua
:
de cada código<rule><beforbreak>
. -
<regra> <afterbreak>
Uma expressão regular para um caractere após uma quebra (por exemplo, no início de uma nova sentença; um espaço e maiúscula).
-
-
Gravar o arquivo SRX modificado.
Para upload regras de segmentação modificadas ou novas, execute estas etapas:
-
Na página Configurações
role para baixo até a seção e clique em Segmentação.
A página
é aberta. -
Clique em Novo.
A página
é aberta. -
Selecione um
da lista suspensa. -
Forneça um
para a regra. -
Clique no arquivo escolher.
Uma janela de seleção de arquivos é aberta.
-
Selecione o arquivo de regras modificado para upload.
-
Verifique
se as regras de segmentação personalizadas serão as regras de segmentação primárias para o idioma selecionado. -
Clique em Criar.
A página
é aberta e a regra foi adicionada à lista.
Para usar regras personalizadas ao importar um trabalho, execute estas etapas:
-
Na etapa 8 da criação de um trabalho, clique em segmentação e extensão do segmento a partir das .
A área suspenso de opções de
é aberta. -
Selecione as regras modificadas da lista suspensa de regras de
. -
Clique em Criar.
O trabalho é criado e adicionado à lista usando as regras de segmentação especificadas.
Remover todas as regras de segmentação interna de um arquivo SRX deixando apenas a segmentação básica do parágrafo, elemento ou célula inteira a ser aplicada. Esta regra de segmentação pode ser aplicada a todos os tipos de arquivos (MS Word, XML, HTML, Excel, etc.).
Exemplo:
Este exemplo de XLSX importado com segmentação padrão terá 3 segmentos: Peter!, Espere! e Olá.
Se toda a segmentação interna for removida deixando apenas a segmentação básica com base na Célula, então serão apenas dois segmentos: Peter! Espere! e Olá.
Edite o arquivo SRX para remover todas as regras padrão de segmentação, ou seja, o código entre <!-- regras de quebra -->
e </languagerule>
.
Exemplo:
O acasalamento pode causar que este exemplo não trabalhe. Neste caso, abra o arquivo SRX editado em Notepad++, encontre os dois atributos do elemento cabeçalho
e altere os dois para não
.