Transcrição de Áudio (Estúdio)

O conteúdo de toda a Central de Ajuda é traduzido automaticamente de inglês pelo Phrase Language AI.

A transcrição de áudio recebe áudio como entrada e utiliza Reconhecimento Automático de Fala e Identificação Automática de Falantes para gerar a saída de texto. Especificamente, o sistema utiliza uma instância proprietária do sistema de Reconhecimento Automático de Fala OpenAI Whisper.

Bases de termos monolíngues podem ser criadas na página de Configurações para melhorar a precisão da transcrição da IA para termos especializados ou difíceis. As bases de termos são compartilhadas automaticamente com todos os usuários da mesma organização em modo não editável.

O Phrase Studio consome Horas de Localização de Vídeo.

Casos de uso

Uma entrevista de cliente de 45 minutos gravada como um arquivo MP4.

Uma transcrição de texto está sendo gerada com identificação de falantes, que pode ser usada para criar um estudo de caso e extrair citações para um site.

Para criar um projeto de transcrição de áudio, siga estas etapas:

No Phrase Studio, clique em Novo Projeto.

A página Criar novo projeto é aberta.
Arraste um arquivo para o campo de upload ou clique em Upload de arquivo para localizar um arquivo no seu sistema.

O arquivo enviado é exibido.
Opcionalmente, especifique o número de Falantes no arquivo enviado.
- Para definir o número de falantes manualmente, abra o menu suspenso e selecione um valor de 1 a 5. Se o arquivo incluir mais de cinco falantes, use a opção padrão Detecção automática.
Forneça um nome para o projeto e defina a visibilidade do projeto conforme necessário:
- Novos projetos são públicos por padrão. Projetos públicos são visíveis para todos os usuários da organização que têm acesso ao Estúdio.
- Desmarque Projeto público para criar um projeto privado que seja visível apenas para o proprietário do projeto. Um projeto privado ainda pode ser compartilhado com usuários selecionados, se necessário.
Selecione manualmente o Idioma de origem ou ative Detecção automática do idioma de origem para detecção automática.
Se necessário, em Opções de localização, ative Traduzir legendas e selecione o(s) idioma(s) para o arquivo a ser traduzido.
- O mecanismo de tradução é configurável.
- Se Dublar em idiomas de destino estiver selecionado, o arquivo será transcrito, traduzido e dublado imediatamente, sem a oportunidade de verificar a tradução antes.
Selecione um Perfil de legenda para determinar as regras de exibição das legendas.

Ative Usar perfis de legenda diferentes para idiomas específicos para selecionar um perfil para cada idioma.
Opcionalmente, ative Aplicar regras de pronúncia para melhorar a precisão do texto para fala para selecionar pronúncias existentes e pares relacionados para fluxos de trabalho de dublagem.
Se necessário, configure opções adicionais:
- Abra a seção Legendas para importar arquivos de legenda existentes em formato SRT ou VTT para os idiomas de origem e destino.
  
  O sistema ignorará a transcrição automática de áudio com identificação de falantes e alinhará as legendas existentes com o vídeo. Os usuários precisam criar e atribuir falantes manualmente, uma vez que os arquivos SRT/VTT não incluem informações sobre os falantes.
- Abra a seção Tradução automatizada para substituir as configurações em nível de conta e selecionar o mecanismo de tradução preferido em nível de projeto.
  - Se Phrase Language AI estiver selecionado, os menus suspensos Perfil de MT e Memória de tradução são exibidos.
    
    Selecione um dos perfis de MT disponíveis e, opcionalmente, uma TM.
  - Se Agente de tradução por IA estiver selecionado, o menu suspenso Memória de tradução é exibido.
    
    Selecione uma das TMs disponíveis.
- Abra a seção Recursos para selecionar uma base de termos existente ou adicionar termos que serão usados para detectar e corresponder palavras semelhantes durante a transcrição.
- Abra a seção Sumários e insights gerados por IA para selecionar os sumários e insights desejados que serão gerados para a gravação enviada, e os modelos de IA relevantes.
Clique Criar projeto.

O arquivo é enviado e é exibido na página Minhas Gravações.

Clique no nome da gravação para abri-la no editor e visualizá-la nas abas Transcrever e Tradução. Ambos os textos podem ser editados, se necessário.

Clique Download para selecionar a transcrição e as traduções para download no seu sistema. Também é possível baixar faixas apenas de áudio em formato MP3.

Resumos de IA

Extrai insights estruturados e significativos, como resumos, sentimentos, bandeiras de qualidade ou problemas de segurança, de legendas usando modelos de IA.

Os insights criados na página Configurações são compartilhados automaticamente com todos os usuários da mesma organização em modo somente leitura.

Casos de uso

Resuma chamadas de suporte ao cliente ou identifique comunicações potencialmente inseguras ou de baixa qualidade. O Phrase Studio retorna um resumo e sinaliza seções para revisão.

Identificação de Falantes

Detecta e rotula diferentes falantes em um arquivo de áudio para transcrições e legendas mais claras.

A identificação automática de falantes não está disponível para projetos com arquivos de legendas importados.

Casos de uso

Um podcast com múltiplos participantes é processado e cada falante é automaticamente marcado (por exemplo, "Falante 1", "Falante 2").

Clique Gerenciar Falantes no menu Transcrever para editar o nome do falante ou adicionar outros falantes.

Use o botão Combinado/Falantes na parte inferior do editor para alternar entre uma única forma de onda e formas de onda individuais para cada falante. Quando múltiplos falantes são detectados, os segmentos podem ser arrastados dentro de uma linha para refletir fala sobreposta, ou movidos para outra linha para alterar o falante designado.