La trascrizione audio prende l'audio come input e utilizza il riconoscimento vocale automatico e l'identificazione automatica degli oratori per generare un output testuale. Specificamente, il sistema utilizza un'istanza proprietaria del sistema di riconoscimento vocale automatico OpenAI Whisper.
Le basi terminologiche monolingue possono essere create nella pagina per migliorare l'accuratezza della trascrizione IA per termini specializzati o difficili. Le basi terminologiche sono automaticamente condivise con tutti gli utenti della stessa organizzazione in modalità sola lettura.
Phrase Studio consuma Ore di localizzazione video.
Casi d'uso
-
Un'intervista con un cliente di 45 minuti registrata come file MP4.
Un trascritto testuale viene generato con identificazione degli oratori, che può essere utilizzato per creare uno studio di caso e estrarre citazioni per un sito web.
Per creare un progetto di trascrizione audio, segui questi passaggi:
-
Da Phrase Studio, clicca su Nuovo Progetto.
Si apre la pagina .
-
Trascina un file nel campo di caricamento oppure clicca su Carica file per localizzare un file sul tuo sistema.
Il file caricato viene visualizzato.
-
Facoltativamente, specifica il numero di nel file caricato.
-
Per impostare manualmente il numero di oratori, apri il menu a discesa e seleziona un valore da 1 a 5. Se il file include più di cinque oratori, utilizza l'opzione predefinita .
-
-
Fornisci un nome per il progetto e imposta la visibilità del progetto come richiesto:
-
I nuovi progetti sono pubblici per impostazione predefinita. I progetti pubblici sono visibili a tutti gli utenti dell'organizzazione che hanno accesso a Studio.
-
Deseleziona per creare un progetto privato visibile solo al proprietario del progetto. Un progetto privato può comunque essere condiviso con utenti selezionati se necessario.
-
-
Seleziona manualmente la o abilita per la rilevazione automatica.
-
Se necessario, sotto , abilita e seleziona la/e lingua/e in cui tradurre il file.
-
Il motore di traduzione è configurabile.
-
Se è selezionato, il file sarà trascritto, tradotto e doppiato immediatamente senza la possibilità di controllare la traduzione in anticipo.
-
-
Seleziona un per determinare le regole di visualizzazione dei sottotitoli.
Abilita per selezionare un profilo per ogni lingua.
-
Facoltativamente, abilita per selezionare le pronunce esistenti e le coppie correlate per i flussi di lavoro di doppiaggio.
-
Se necessario, configura opzioni aggiuntive:
-
Apri la sezione per importare file di sottotitoli esistenti in formato SRT o VTT per le lingue di origine e di destinazione.
Il sistema salterà la trascrizione audio automatica con identificazione degli oratori e allineerà i sottotitoli esistenti con il video. Gli utenti devono creare e assegnare manualmente gli oratori poiché i file SRT/VTT non includono informazioni sugli oratori.
-
Apri la sezione per sovrascrivere le impostazioni a livello di account e selezionare il preferito a livello di progetto.
-
Apri la sezione per selezionare una termbase esistente o aggiungere termini che verranno utilizzati per rilevare e abbinare parole simili durante la trascrizione.
-
Apri la sezione per selezionare i riepiloghi e gli approfondimenti desiderati che verranno generati per la registrazione caricata e i modelli di IA pertinenti.
-
-
Clicca crea progetto.
Il file è caricato e viene visualizzato nella pagina .
Clicca sul nome della registrazione per aprirlo nell'editor e visualizzarlo nelle schede e . Entrambi i testi possono essere modificati se necessario.
Clicca Download per selezionare la trascrizione e le traduzioni da scaricare sul tuo sistema. È anche possibile scaricare tracce audio solo in formato MP3.
Estrae informazioni strutturate e significative come riepiloghi, sentimenti, flag di qualità o problemi di sicurezza dai sottotitoli utilizzando modelli di IA.
Le informazioni create nella pagina vengono automaticamente condivise con tutti gli utenti della stessa organizzazione in modalità sola lettura.
Casi d'uso
-
Riepiloga le chiamate di supporto clienti o identifica comunicazioni potenzialmente non sicure o di bassa qualità. Phrase Studio restituisce un riepilogo e segnala sezioni per la revisione.
Rileva e etichetta diversi oratori in un file audio per trascrizioni e sottotitoli più chiari.
L'identificazione automatica degli oratori non è disponibile per progetti con file di sottotitoli importati.
Casi d'uso
-
Un podcast con più partecipanti viene elaborato e ogni oratore viene automaticamente contrassegnato (ad es., "Oratore 1", "Oratore 2").
Clicca Gestisci oratori nel menu per modificare il nome dell'oratore o aggiungere altri oratori.
Usa l'interruttore Combinato/Oratori in fondo all'editor per passare tra un'unica forma d'onda e forme d'onda individuali per ciascun oratore. Quando vengono rilevati più oratori, i segmenti possono essere trascinati all'interno di una riga per riflettere il discorso sovrapposto, o spostati in un'altra riga per cambiare l'oratore assegnato.