Custom AI

Create a Dataset

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

Directrizes de seleção de memória de tradução

O Phrase Custom AI utiliza memórias de tradução (TMS) para criar modelos personalizados de tradução automática (tradução automática) que aderem a terminologia e estilo específicos, levando a uma melhor qualidade de tradução (e, portanto, reduzir tempos de pós-edição) para esses tipos de conteúdo quando comparados com a tradução automática genérica.

O fator mais importante que pode influenciar a eficácia do processo de personalização é a memória de tradução usada. Estas são orientações gerais que podem Ajuda para determinar quais dados usar para esse propósito:

  • Domaino único:

    É melhor se o conjunto de dados estiver focado em conteúdo que abranja um único estilo e terminologia. Se o conjunto de dados contiver uma mistura de temas (p.ex., os termos legais de um site e as descrições de produto), o modelo pode falhar em aprender qual é o estilo desejado.

  • Tipo de conteúdo exclusivo:

    O modelo de tradução automática personalizada assenta em modelos genéricos treinados em grandes quantidades de dados públicos recolhidos da internet. Se a memória de tradução conter dados que sejam muito semelhantes aos dados genéricos usados na construção dos modelos genéricos, não haverá muito para ganhar com o processo de personalização.

  • Qualidade dos dados:

    O modelo assumirá que cada par de frases na memória de tradução é um exemplo da saída que será esperada produzir. A memória de tradução deve ser de boa qualidade, idealmente criada a partir de traduções humanas Professional. A pipeline de limpeza de dados pode Ajuda para filtrar as partes mais prejudiciais do conjunto de dados.

  • Volume esperado:

    Para que a personalização seja impactante em termos de ROI, o conjunto de dados precisa ser representativo da maior parte dos dados em que a qualidade da tradução automática terá maior impacto. Por exemplo, caso parte da saída da tradução automática seja pós-edição por tradutores humanos, os dados precisam ser representativos do conteúdo que será pós-edição para maximizar o ROI.

Para criar um conjunto de dados para treinar um mecanismo de tradução automática personalizado, execute estas etapas:

  1. Na página de conjuntos de dados, clique em Aprender um mecanismo de tradução automática personalizado.

    A página detalhes do conjunto de dados é aberta.

  2. Forneça um nome para o conjunto de dados.

  3. Os seletores de idiomas permitem várias opções:

    1. Para criar um conjunto de dados de idioma geral, selecione os mesmos idiomas de texto original e tradução nos seletores de idioma e local do texto original e tradução.

    2. Para criar um conjunto de dados local, selecione os idiomas de texto original e tradução da primeira lista suspensa e especifique os locais de texto original e tradução da segunda lista suspensa.

      Vários locais de tradução para aproveitar mais fontes de dados também podem ser adicionados.

    3. Para criar um conjunto de dados com vários locais de texto original e tradução, selecione os idiomas de texto original e tradução a partir da primeira lista suspenso, especifique os locais de texto original e tradução a partir da segunda lista suspenso (é possível adicionar vários locais de tradução) e clique em + Adicionar mais pares de locais.

    A janela Dados de entrada é exibida.

  4. Clique em Adicionar memórias de tradução.

    A página Choose translation memories é aberta com uma search.jpg de funcionalidades de pesquisa.

  5. Para adicionar uma memória de tradução ao conjunto de dados, clique no ícone de AddTM.jpg. A memória de tradução está adicionada à coluna Selecionada.

    Várias TMS podem ser adicionadas ao máximo de 200 e, idealmente, um conjunto de dados deve conter pelo menos 10.000 segmentos.

    Clicar no nome da memória de tradução apresentará a seleção na página da memória de tradução.

    Clique no ícone de RemoveTM.jpg para remover a memória de tradução da coluna Selecionada.

  6. Clique em Gravar.

    A página detalhes do conjunto de dados é aberta.

  7. Revise os detalhes conforme apresentados e, se estiver correto, clique em Continuar.

    A página Limpeza de filtros é aberta.

  8. Aplicar filtros obrigatórios e clicar em Criar.

    O conjunto de dados é criado e adicionado à lista na página de conjuntos de dados com o estado inicial de limpeza e o estado de tradução automática na coluna Criado para.

Esse artigo foi útil?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.