Gerenciamento de projetos

Segmentation Rules (TMS)

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

Segmentação

Segmentação É a divisão de textos originais em partes menores. Isso melhora a recuperação de texto já traduzido a partir de uma memória de tradução. Os segmentos são apresentados no editor e podem ser filtrados.

As regras padrão de segmentação correspondem aos detalhes de cada idioma aceito e podem ser personalizadas.

Trabalhos importados com segmentação ruim, como arquivos de documentos com mal formato ou a aplicação de personalização de segmentação inadequada, podem afetar os valores de correspondência da memória de tradução.

Exemplo:

Boa segmentação:

  • As memórias de tradução com idiomas de tradução multilíngues são compatíveis e podem ser usadas de forma bidirecional.

    Valor de correspondência de 100%.

Segmentação ruim

  • Existem memórias de tradução com idiomas de tradução multilíngues.

    Valor de correspondência de 100%.

  • e pode ser usado de forma bidirecional.

    Valor de correspondência de 63%.

Personalizar regras de segmentação

Regras de segmentação personalizadas podem ser aplicadas a trabalhos e projetos. Se um projeto exigir uma regra de segmentação personalizada, um modelo será necessário criar para esse projeto. Quando definidos como primários, regras de segmentação personalizadas são aplicadas a todos os novos trabalhos importados para esse idioma de texto original.

Existem dois tipos de regras de segmentação:

  • Abreviações para o arquivo .XLSX

  • Expressão regular de arquivos .SRX

Para usar regras personalizadas, baixe as regras padrão, modifique-as, upload o arquivo modificado e depois aplique-as aos trabalhos especificados.

Atenção

Ao adicionar regras de segmentação personalizado para um idioma de texto original do CJK sem espaço (quando um idioma de tradução usará espaços como delimitador de palavras), certifique-se de que os espaços no início ou no fim do segmento de tradução são adicionados aos segmentos dividir pela regra personalizado; isso delimita palavras na tradução. Embora isso ocorra automaticamente em segmentos formados por regras padrão de segmentação, nenhum espaço é adicionado em segmentos divididos manualmente ou que são formados por regras adicionais de segmentação personalizadas.

Baixar regras padrão de segmentação

Para baixar as regras padrão de segmentação, siga estes passos:

  1. Na página Configurações Setup_gear.png role para baixo até a seção Configurações do projeto e clique em Segmentação.

    A página Segmentação é aberta.

  2. Selecione o idioma para personalizar e clique em Exportar XLSX/SRX.

    A janela Exportar XLSX/SRX é aberta.

  3. Selecionar formato:

    • O XLSX fornece uma lista de abreviações.

    • O SRX fornece regras expressão regulares.

  4. Selecione um idioma da lista suspensa.

  5. Clique Baixar.

    O arquivo foi baixado para o seu sistema.

Para baixar uma regra de segmentação carregada anteriormente que você fez upload anteriormente, execute estas etapas:

  1. Na página Configurações Setup_gear.png role para baixo até a seção Configurações do projeto e clique em Segmentação.

    A página Segmentação é aberta.

  2. Clique no ícone configurações à direita e escolha personalizar colunas: customize-segmentation-columns.png

  3. Ativar a coluna Nome de arquivo

  4. Clique em um nome de arquivo para baixar uma regra pré-gravada.

Editar abreviações em um arquivo .XLSX

As abreviações podem ser especificadas para idiomas individuais após os quais novos segmentos não devem ser criados.

Para editar abreviações, siga estes passos:

  1. Abra o arquivo .XLSX baixado em um editor.

  2. Altere o conteúdo com a seguinte formatação:

    O arquivo XLSX deve ter duas colunas sem cabeçalhos.

    • Coluna 1: Abreviação a ser especificada

    • Coluna 2: Especificação do comportamento de segmentação

      • ABBR_UPPER_NUM

        Um novo segmento não será criado se a abreviação for seguida de espaço branco e, em seguida, de um número, um símbolo (matema, sinais de moeda, sinalizadores, etc.) ou uma palavra com a primeira letra no caso superior.

      • ABBR_NUM

        Um novo segmento não será criado se a abreviação for seguida por espaço em branco e, em seguida, por um número.

  3. Gravar o arquivo .XLSX editado.

Editar expressões regulares em um arquivo .SRX

A edição de arquivos .SRX é um processo complexo adequado apenas para usuários experientes no uso de expressões regulares

Existem várias regras que podem ser alteradas em um arquivo SRX:

  • Importar texto de um arquivo XLSX sem segmentação; uma célula é igual a um segmento.

  • Importe texto com uma nova linha do pedido para dividir um segmento em dois.

  • Use um colon (ou qualquer outro caractere) como um separador de segmento.

  • Proibir o usar de um semicolão (ou qualquer outro caractere) como um separador de segmento.

  • Removendo uma abreviação da lista (o texto será segmentado).

Essas regras são caracteres; apenas um único caractere pode ser usado como separador de segmento. Aos grupos de caracteres (por exemplo: <p>) não é possível usar como separador de segmento.

Para editar um arquivo SRX, siga estes passos:

  1. Abra o arquivo em um editor de texto como Notepad ++.

  2. Edite usando expressões regulares ou remova completamente a segmentação interna.

    Exemplo:

    BreakRules_Example.png
    • <rule break="no">

      A lista de regras onde o segmento não será quebrado. Ou seja, uma lista de abreviações

    • <regra> <beforebreak>

      Uma expressão regular para um caractere antes de uma quebra (por exemplo, no final de uma sentença ". ? :"). Se você, por exemplo, não quiser segmentar texto após um colo, simplesmente exclua : de cada código <rule><beforbreak>.

    • <regra> <afterbreak>

      Uma expressão regular para um caractere após uma quebra (por exemplo, no início de uma nova sentença; um espaço e maiúscula).

  3. Gravar o arquivo SRX modificado.

Upload novas regras de segmentação

Para upload regras de segmentação modificadas ou novas, execute estas etapas:

  1. Na página Configurações Setup_gear.png role para baixo até a seção Configurações do projeto e clique em Segmentação.

    A página Segmentação é aberta.

  2. Clique em Novo.

    A página Fazer upload do arquivo de segmentação XLSX ou SRX personalizado é aberta.

  3. Selecione um idioma da lista suspensa.

  4. Forneça um nome para a regra.

  5. Clique no arquivo escolher.

    Uma janela de seleção de arquivos é aberta.

  6. Selecione o arquivo de regras modificado para upload.

  7. Verifique Primariamente se as regras de segmentação personalizadas serão as regras de segmentação primárias para o idioma selecionado.

  8. Clique em Criar.

    A página Segmentação é aberta e a regra foi adicionada à lista.

Usar regras de segmentação personalizadas ao importar trabalho

Para usar regras personalizadas ao importar um trabalho, execute estas etapas:

  1. Na etapa 8 da criação de um trabalho, clique em segmentação e extensão do segmento a partir das configurações de importação de arquivos.

    A área suspenso de opções de segmentação e extensão de segmentos é aberta.

  2. Selecione as regras modificadas da lista suspensa de regras de segmentação do texto original.

  3. Clique em Criar.

    O trabalho é criado e adicionado à lista usando as regras de segmentação especificadas.

Exemplo de segmentação em mudança (1 segmento da célula 1)

Remover todas as regras de segmentação interna de um arquivo SRX deixando apenas a segmentação básica do parágrafo, elemento ou célula inteira a ser aplicada. Esta regra de segmentação pode ser aplicada a todos os tipos de arquivos (MS Word, XML, HTML, Excel, etc.).

Exemplo:

A

B

1

Peter! Espere!

2

Olá.

3

Este exemplo de XLSX importado com segmentação padrão terá 3 segmentos: Peter!, Espere! e Olá.

Se toda a segmentação interna for removida deixando apenas a segmentação básica com base na Célula, então serão apenas dois segmentos: Peter! Espere! e Olá.

Edite o arquivo SRX para remover todas as regras padrão de segmentação, ou seja, o código entre <!-- regras de quebra --> e </languagerule>.

Exemplo:

1cell-1segment-srx.png

O acasalamento pode causar que este exemplo não trabalhe. Neste caso, abra o arquivo SRX editado em Notepad++, encontre os dois atributos do elemento cabeçalho e altere os dois para não.

Esse artigo foi útil?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.