Directivas de seleção de memória de tradução
O Phrase Custom AI utiliza memórias de tradução (TMs) para criar modelos de tradução automática personalizados que adiram a terminologia e estilo específicos, levando a uma melhor qualidade de tradução (e, portanto, reduzir tempos de pós-edição) para esses tipos de conteúdo em comparação com a tradução automática genérica.
O fator mais importante que pode influenciar a eficácia do processo de personalização é a memória de tradução usada. Estas são orientações gerais que podem ajudar a determinar quais dados usar para esse fim:
-
Tema único:
É melhor se o conjunto de dados estiver focado em conteúdo que abranja um único estilo e terminologia. Se o conjunto de dados contiver uma mistura de temas (p.ex., os termos legais de um site e as descrições de produto), o modelo pode falhar em aprender qual é o estilo desejado.
-
Tipo de conteúdo exclusivo:
O modelo de tradução automática personalizada assenta em modelos genéricos treinados em grandes quantidades de dados públicos coletados da internet. Se a memória de tradução contiver dados que são muito semelhantes aos dados genéricos usados na construção dos modelos genéricos, não haverá muito para ser ganho com o processo de personalização.
-
Qualidade dos dados:
O modelo assumirá que cada par de frases na memória de tradução é um exemplo da saída que será esperado produzir. A memória de tradução deve ser de boa qualidade, idealmente criada a partir de traduções humanas profissionais. O pipeline de limpeza de dados pode ajudar a filtrar as partes mais prejudiciais do conjunto de dados.
-
Volume esperado:
Para que a personalização seja impactante em termos de ROI, o conjunto de dados precisa ser representativo da maior parte dos dados em que a qualidade da tradução automática terá maior impacto. Por exemplo, se algum resultado da tradução automática for pós-edição por tradutores humanos, para maximizar o ROI os dados precisam ser representativos do conteúdo que será pós-edição.
Criar um conjunto de dados para cura de ativos automatizados tem um processo ligeiramente diferente.
Para criar um conjunto de dados com o fim de treinar um mecanismo de tradução automática personalizado, execute estas etapas:
-
Na página de Trenar um mecanismo de tradução automática personalizado.
, clique emA página
é aberta. -
Forneça um nome para o conjunto de dados.
-
Os seletores de idiomas permitem várias opções:
-
Para criar um conjunto de dados de idioma geral, selecione os mesmos idiomas de origem e destino nos seletores de idioma de origem e destino e locais.
-
Para criar um conjunto de dados local específico, selecione os idiomas de origem e de destino da primeira lista suspensa e especifique os locais de origem e de destino da segunda lista suspensa.
Vários locais de tradução para aproveitar mais fontes de dados também podem ser adicionados.
-
Para criar um conjunto de dados com vários locais de origem e destino, selecione os idiomas de origem e destino da primeira lista suspensa, especifique os locais de origem e destino da segunda lista suspensa (possível adicionar vários locais de destino) e clique em + Adicionar mais pares de locais.
A janela
é exibida. -
-
Clique em Adicionar memórias de tradução.
A página
é aberta com umade funcionalidades de pesquisa.
-
Para adicionar uma memória de tradução ao conjunto de dados, clique no ícone de
. A memória de tradução é adicionada à coluna .
As memórias de tradução múltiplas podem ser adicionadas ao máximo de 200 memórias de tradução e a um máximo de 8 milhões de segmentos. Em ideal, um conjunto de dados deve conter pelo menos 10.000 segmentos.
Clicar no nome da memória de tradução apresentará a seleção na página de memória de tradução.
Clique no ícone de
para remover a memória de tradução da coluna .
-
Clique em Gravar.
A página
é aberta. -
Revise os detalhes conforme apresentados e, se estiver correto, clique em Continuar.
A página
é aberta. -
Aplicar filtros obrigatórios e clicar em criar.
O conjunto de dados é criado e adicionado à lista na página de conjuntos de
com o estado inicial de e o estado de na coluna .