Custom AI

Datasets Page

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

Os conjuntos de dados criados são apresentados em uma tabela na página de conjuntos de dados. Algumas tabelas podem ser ordenadas clicando em cabeçalhos de colunas. Clicar no nome do conjunto de dados abre a visualização para a seleção. Os conjuntos de dados podem ser renomeados ou excluídos do menu_dots.png de menu de três pontos na visão geral.

O 3dots_icon.jpeg do menu Mais também pode ser usado para abrir a visualização, mostrar filtros de limpeza e histórico de limpeza, baixar conjunto de dados ou excluir o conjunto de dados.

No caso de uma limpeza falhar e apresentar um estado de erro, clique em Repetir CAI_Retry.pngno menu Mais para fazer outra tentativa.

Visão geral do conjunto de dados

A visão geral fornece informações sobre a limpeza com abas para revisar os filtros aplicados e um histórico da limpeza do conjunto de dados selecionado. A distribuição dos filtros de limpeza é exibida junto com todos os metadados.

Aba:

  • Overview

    Exibe a visão geral desse conjunto de dados e a distribuição de filtros de limpeza.

  • Limpeza de filtros

    Se limpar apenas uma vez, mostra os resultados dos filtros selecionados para o treinamento inicial. Se mais limpezas forem feitas, a configuração para a última limpeza será exibida.

    Para alterar os filtros, siga estes passos:

    1. No lado direito da página, clique em Editar filtros .

      A página Editar filtros de limpeza é aberta.

    2. Clique em editar em um filtro que requer uma alteração.

      As opções de filtro são abertas.

    3. Faça as alterações necessárias e clique em Gravar.

      As alterações são exibidas e o botão Recuperar está ativado.

    4. Clique em Rever para atualizar a limpeza.

  • Histórico de limpeza

    Uma tabela de limpezas é apresentada.

Conjunto de dados de evaluação

Isso só é exibido se o objetivo do conjunto de dados for o treinamento de tradução automática. O número de segmentos selecionados para avaliação do modelo de tradução automática personalizada é determinado pelo menor dos seguintes dois critérios:

  • 10% do conjunto de dados total.

  • Uma contagem fixa de 3.000 segmentos.

Estes segmentos são exclusivamente para avaliação e não são usados durante a fase de treinamento do modelo.

Esse artigo foi útil?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.