A transcrição de áudio recebe áudio como entrada e utiliza Reconhecimento Automático de Fala e Identificação Automática de Falantes para gerar a saída de texto. Especificamente, o sistema utiliza uma instância proprietária do sistema de Reconhecimento Automático de Fala OpenAI Whisper.
Bases de termos monolíngues podem ser criadas na página de para melhorar a precisão da transcrição da IA para termos especializados ou difíceis. As bases de termos são compartilhadas automaticamente com todos os usuários da mesma organização em modo não editável.
O Phrase Studio consome Horas de Localização de Vídeo.
Casos de uso
-
Uma entrevista de cliente de 45 minutos gravada como um arquivo MP4.
Uma transcrição de texto está sendo gerada com identificação de falantes, que pode ser usada para criar um estudo de caso e extrair citações para um site.
Para criar um projeto de transcrição de áudio, siga estas etapas:
-
No Phrase Studio, clique em Novo Projeto.
A página é aberta.
-
Arraste um arquivo para o campo de upload ou clique em Upload de arquivo para localizar um arquivo no seu sistema.
O arquivo enviado é exibido.
-
Opcionalmente, especifique o número de no arquivo enviado.
-
Para definir o número de falantes manualmente, abra o menu suspenso e selecione um valor de 1 a 5. Se o arquivo incluir mais de cinco falantes, use a opção padrão .
-
-
Forneça um nome para o projeto e defina a visibilidade do projeto conforme necessário:
-
Novos projetos são públicos por padrão. Projetos públicos são visíveis para todos os usuários da organização que têm acesso ao Estúdio.
-
Desmarque para criar um projeto privado que seja visível apenas para o proprietário do projeto. Um projeto privado ainda pode ser compartilhado com usuários selecionados, se necessário.
-
-
Selecione manualmente o ou ative para detecção automática.
-
Se necessário, em , ative e selecione o(s) idioma(s) para o arquivo a ser traduzido.
-
O mecanismo de tradução é configurável.
-
Se estiver selecionado, o arquivo será transcrito, traduzido e dublado imediatamente, sem a oportunidade de verificar a tradução antes.
-
-
Selecione um para determinar as regras de exibição das legendas.
Ative para selecionar um perfil para cada idioma.
-
Opcionalmente, ative para selecionar pronúncias existentes e pares relacionados para fluxos de trabalho de dublagem.
-
Se necessário, configure opções adicionais:
-
Abra a seção para importar arquivos de legenda existentes em formato SRT ou VTT para os idiomas de origem e destino.
O sistema ignorará a transcrição automática de áudio com identificação de falantes e alinhará as legendas existentes com o vídeo. Os usuários precisam criar e atribuir falantes manualmente, uma vez que os arquivos SRT/VTT não incluem informações sobre os falantes.
-
Abra a seção para substituir as configurações em nível de conta e selecionar o preferido em nível de projeto.
-
Abra a seção para selecionar uma base de termos existente ou adicionar termos que serão usados para detectar e corresponder palavras semelhantes durante a transcrição.
-
Abra a seção para selecionar os sumários e insights desejados que serão gerados para a gravação enviada, e os modelos de IA relevantes.
-
-
Clique Criar projeto.
O arquivo é enviado e é exibido na página .
Clique no nome da gravação para abri-la no editor e visualizá-la nas abas e . Ambos os textos podem ser editados, se necessário.
Clique Download para selecionar a transcrição e as traduções para download no seu sistema. Também é possível baixar faixas apenas de áudio em formato MP3.
Extrai insights estruturados e significativos, como resumos, sentimentos, bandeiras de qualidade ou problemas de segurança, de legendas usando modelos de IA.
Os insights criados na página são compartilhados automaticamente com todos os usuários da mesma organização em modo somente leitura.
Casos de uso
-
Resuma chamadas de suporte ao cliente ou identifique comunicações potencialmente inseguras ou de baixa qualidade. O Phrase Studio retorna um resumo e sinaliza seções para revisão.
Detecta e rotula diferentes falantes em um arquivo de áudio para transcrições e legendas mais claras.
A identificação automática de falantes não está disponível para projetos com arquivos de legendas importados.
Casos de uso
-
Um podcast com múltiplos participantes é processado e cada falante é automaticamente marcado (por exemplo, "Falante 1", "Falante 2").
Clique Gerenciar Falantes no menu para editar o nome do falante ou adicionar outros falantes.
Use o botão Combinado/Falantes na parte inferior do editor para alternar entre uma única forma de onda e formas de onda individuais para cada falante. Quando múltiplos falantes são detectados, os segmentos podem ser arrastados dentro de uma linha para refletir fala sobreposta, ou movidos para outra linha para alterar o falante designado.