Directrizes de seleção de memória de tradução
O Phrase Custom AI utiliza memórias de tradução (TMS) para criar modelos personalizados de tradução automática (tradução automática) que aderem a terminologia e estilo específicos, levando a uma melhor qualidade de tradução (e, portanto, reduzir tempos de pós-edição) para esses tipos de conteúdo quando comparados com a tradução automática genérica.
O fator mais importante que pode influenciar a eficácia do processo de personalização é a memória de tradução usada. Estas são orientações gerais que podem Ajuda para determinar quais dados usar para esse propósito:
-
Domaino único:
É melhor se o conjunto de dados estiver focado em conteúdo que abranja um único estilo e terminologia. Se o conjunto de dados contiver uma mistura de temas (p.ex., os termos legais de um site e as descrições de produto), o modelo pode falhar em aprender qual é o estilo desejado.
-
Tipo de conteúdo exclusivo:
O modelo de tradução automática personalizada assenta em modelos genéricos treinados em grandes quantidades de dados públicos recolhidos da internet. Se a memória de tradução conter dados que sejam muito semelhantes aos dados genéricos usados na construção dos modelos genéricos, não haverá muito para ganhar com o processo de personalização.
-
Qualidade dos dados:
O modelo assumirá que cada par de frases na memória de tradução é um exemplo da saída que será esperada produzir. A memória de tradução deve ser de boa qualidade, idealmente criada a partir de traduções humanas Professional. A pipeline de limpeza de dados pode Ajuda para filtrar as partes mais prejudiciais do conjunto de dados.
-
Volume esperado:
Para que a personalização seja impactante em termos de ROI, o conjunto de dados precisa ser representativo da maior parte dos dados em que a qualidade da tradução automática terá maior impacto. Por exemplo, caso parte da saída da tradução automática seja pós-edição por tradutores humanos, os dados precisam ser representativos do conteúdo que será pós-edição para maximizar o ROI.
Para criar um conjunto de dados para treinar um mecanismo de tradução automática personalizado, execute estas etapas:
-
Na página de Aprender um mecanismo de tradução automática personalizado.
, clique emA página
é aberta. -
Forneça um nome para o conjunto de dados.
-
Os seletores de idiomas permitem várias opções:
-
Para criar um conjunto de dados de idioma geral, selecione os mesmos idiomas de texto original e tradução nos seletores de idioma e local do texto original e tradução.
-
Para criar um conjunto de dados local, selecione os idiomas de texto original e tradução da primeira lista suspensa e especifique os locais de texto original e tradução da segunda lista suspensa.
Vários locais de tradução para aproveitar mais fontes de dados também podem ser adicionados.
-
Para criar um conjunto de dados com vários locais de texto original e tradução, selecione os idiomas de texto original e tradução a partir da primeira lista suspenso, especifique os locais de texto original e tradução a partir da segunda lista suspenso (é possível adicionar vários locais de tradução) e clique em + Adicionar mais pares de locais.
A janela
é exibida. -
-
Clique em Adicionar memórias de tradução.
A página de funcionalidades de pesquisa.
é aberta com uma -
Para adicionar uma memória de tradução ao conjunto de dados, clique no ícone de . A memória de tradução está adicionada à coluna
.Várias TMS podem ser adicionadas ao máximo de 200 e, idealmente, um conjunto de dados deve conter pelo menos 10.000 segmentos.
Clicar no nome da memória de tradução apresentará a seleção na página da memória de tradução.
Clique no ícone de para remover a memória de tradução da coluna .
-
Clique em Gravar.
A página
é aberta. -
Revise os detalhes conforme apresentados e, se estiver correto, clique em Continuar.
A página
é aberta. -
Aplicar filtros obrigatórios e clicar em Criar.
O conjunto de dados é criado e adicionado à lista na página de conjuntos de
com o estado inicial de e o estado de na coluna .