Custom AI

Create a Dataset

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

Directivas de seleção de memória de tradução

O Phrase Custom AI utiliza memórias de tradução (TMs) para criar modelos de tradução automática personalizados que adiram a terminologia e estilo específicos, levando a uma melhor qualidade de tradução (e, portanto, reduzir tempos de pós-edição) para esses tipos de conteúdo em comparação com a tradução automática genérica.

O fator mais importante que pode influenciar a eficácia do processo de personalização é a memória de tradução usada. Estas são orientações gerais que podem ajudar a determinar quais dados usar para esse fim:

  • Tema único:

    É melhor se o conjunto de dados estiver focado em conteúdo que abranja um único estilo e terminologia. Se o conjunto de dados contiver uma mistura de temas (p.ex., os termos legais de um site e as descrições de produto), o modelo pode falhar em aprender qual é o estilo desejado.

  • Tipo de conteúdo exclusivo:

    O modelo de tradução automática personalizada assenta em modelos genéricos treinados em grandes quantidades de dados públicos coletados da internet. Se a memória de tradução contiver dados que são muito semelhantes aos dados genéricos usados na construção dos modelos genéricos, não haverá muito para ser ganho com o processo de personalização.

  • Qualidade dos dados:

    O modelo assumirá que cada par de frases na memória de tradução é um exemplo da saída que será esperado produzir. A memória de tradução deve ser de boa qualidade, idealmente criada a partir de traduções humanas profissionais. O pipeline de limpeza de dados pode ajudar a filtrar as partes mais prejudiciais do conjunto de dados.

  • Volume esperado:

    Para que a personalização seja impactante em termos de ROI, o conjunto de dados precisa ser representativo da maior parte dos dados em que a qualidade da tradução automática terá maior impacto. Por exemplo, se algum resultado da tradução automática for pós-edição por tradutores humanos, para maximizar o ROI os dados precisam ser representativos do conteúdo que será pós-edição.

Criar um conjunto de dados para cura de ativos automatizados tem um processo ligeiramente diferente.

Para criar um conjunto de dados com o fim de treinar um mecanismo de tradução automática personalizado, execute estas etapas:

  1. Na página de conjuntos de dados, clique em Trenar um mecanismo de tradução automática personalizado.

    A página detalhes do conjunto de dados é aberta.

  2. Forneça um nome para o conjunto de dados.

  3. Os seletores de idiomas permitem várias opções:

    1. Para criar um conjunto de dados de idioma geral, selecione os mesmos idiomas de origem e destino nos seletores de idioma de origem e destino e locais.

    2. Para criar um conjunto de dados local específico, selecione os idiomas de origem e de destino da primeira lista suspensa e especifique os locais de origem e de destino da segunda lista suspensa.

      Vários locais de tradução para aproveitar mais fontes de dados também podem ser adicionados.

    3. Para criar um conjunto de dados com vários locais de origem e destino, selecione os idiomas de origem e destino da primeira lista suspensa, especifique os locais de origem e destino da segunda lista suspensa (possível adicionar vários locais de destino) e clique em + Adicionar mais pares de locais.

    A janela Dados de entrada é exibida.

  4. Clique em Adicionar memórias de tradução.

    A página Choose translation memories é aberta com uma search.jpg de funcionalidades de pesquisa.

  5. Para adicionar uma memória de tradução ao conjunto de dados, clique no ícone de AddTM.jpg. A memória de tradução é adicionada à coluna Selecionada.

    As memórias de tradução múltiplas podem ser adicionadas ao máximo de 200 memórias de tradução e a um máximo de 8 milhões de segmentos. Em ideal, um conjunto de dados deve conter pelo menos 10.000 segmentos.

    Clicar no nome da memória de tradução apresentará a seleção na página de memória de tradução.

    Clique no ícone de RemoveTM.jpg para remover a memória de tradução da coluna Selecionada.

  6. Clique em Gravar.

    A página detalhes do conjunto de dados é aberta.

  7. Revise os detalhes conforme apresentados e, se estiver correto, clique em Continuar.

    A página Limpeza de filtros é aberta.

  8. Aplicar filtros obrigatórios e clicar em criar.

    O conjunto de dados é criado e adicionado à lista na página de conjuntos de dados com o estado inicial de Limpeza e o estado de Trabalho de tradução automática na coluna Criado para.

Esse artigo foi útil?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.