Trascrizione Audio (Studio)

Contenuti tradotti automaticamente dall'inglese con Phrase Language AI.

La trascrizione audio prende l'audio come input e utilizza il riconoscimento vocale automatico e l'identificazione automatica degli oratori per generare un output testuale. Specificamente, il sistema utilizza un'istanza proprietaria del sistema di riconoscimento vocale automatico OpenAI Whisper.

Le basi terminologiche monolingue possono essere create nella pagina Impostazioni per migliorare l'accuratezza della trascrizione IA per termini specializzati o difficili. Le basi terminologiche sono automaticamente condivise con tutti gli utenti della stessa organizzazione in modalità sola lettura.

Phrase Studio consuma Ore di localizzazione video.

Casi d'uso

Un'intervista con un cliente di 45 minuti registrata come file MP4.

Un trascritto testuale viene generato con identificazione degli oratori, che può essere utilizzato per creare uno studio di caso e estrarre citazioni per un sito web.

Per creare un progetto di trascrizione audio, segui questi passaggi:

Da Phrase Studio, clicca su Nuovo Progetto.

Si apre la pagina Crea nuovo progetto.
Trascina un file nel campo di caricamento oppure clicca su Carica file per localizzare un file sul tuo sistema.

Il file caricato viene visualizzato.
Facoltativamente, specifica il numero di Oratori nel file caricato.
- Per impostare manualmente il numero di oratori, apri il menu a discesa e seleziona un valore da 1 a 5. Se il file include più di cinque oratori, utilizza l'opzione predefinita Rilevamento automatico.
Fornisci un nome per il progetto e imposta la visibilità del progetto come richiesto:
- I nuovi progetti sono pubblici per impostazione predefinita. I progetti pubblici sono visibili a tutti gli utenti dell'organizzazione che hanno accesso a Studio.
- Deseleziona Progetto pubblico per creare un progetto privato visibile solo al proprietario del progetto. Un progetto privato può comunque essere condiviso con utenti selezionati se necessario.
Seleziona manualmente la Lingua di origine o abilita Rilevamento automatico della lingua di origine per la rilevazione automatica.
Se necessario, sotto Opzioni di localizzazione, abilita Traduci sottotitoli e seleziona la/e lingua/e in cui tradurre il file.
- Il motore di traduzione è configurabile.
- Se Doppiaggio nelle lingue di destinazione è selezionato, il file sarà trascritto, tradotto e doppiato immediatamente senza la possibilità di controllare la traduzione in anticipo.
Seleziona un Profilo sottotitoli per determinare le regole di visualizzazione dei sottotitoli.

Abilita Usa profili di sottotitoli diversi per lingue specifiche per selezionare un profilo per ogni lingua.
Facoltativamente, abilita Applica regole di pronuncia per migliorare l'accuratezza del testo in voce per selezionare le pronunce esistenti e le coppie correlate per i flussi di lavoro di doppiaggio.
Se necessario, configura opzioni aggiuntive:
- Apri la sezione Sottotitoli per importare file di sottotitoli esistenti in formato SRT o VTT per le lingue di origine e di destinazione.
  
  Il sistema salterà la trascrizione audio automatica con identificazione degli oratori e allineerà i sottotitoli esistenti con il video. Gli utenti devono creare e assegnare manualmente gli oratori poiché i file SRT/VTT non includono informazioni sugli oratori.
- Apri la sezione Traduzione automatizzata per sovrascrivere le impostazioni a livello di account e selezionare il motore di traduzione preferito a livello di progetto.
  - Se Phrase Language AI è selezionato, i menu a discesa Profilo MT e Memoria di traduzione vengono visualizzati.
    
    Seleziona uno dei profili MT disponibili e, facoltativamente, una TM.
  - Se Agente di traduzione IA è selezionato, il menu a discesa Memoria di traduzione viene visualizzato.
    
    Seleziona una delle TM disponibili.
- Apri la sezione Risorse per selezionare una termbase esistente o aggiungere termini che verranno utilizzati per rilevare e abbinare parole simili durante la trascrizione.
- Apri la sezione Riepiloghi e approfondimenti generati dall'IA per selezionare i riepiloghi e gli approfondimenti desiderati che verranno generati per la registrazione caricata e i modelli di IA pertinenti.
Clicca crea progetto.

Il file è caricato e viene visualizzato nella pagina Le mie registrazioni.

Clicca sul nome della registrazione per aprirlo nell'editor e visualizzarlo nelle schede Trascrivi e Traduzione. Entrambi i testi possono essere modificati se necessario.

Clicca Download per selezionare la trascrizione e le traduzioni da scaricare sul tuo sistema. È anche possibile scaricare tracce audio solo in formato MP3.

Riepiloghi IA

Estrae informazioni strutturate e significative come riepiloghi, sentimenti, flag di qualità o problemi di sicurezza dai sottotitoli utilizzando modelli di IA.

Le informazioni create nella pagina Impostazioni vengono automaticamente condivise con tutti gli utenti della stessa organizzazione in modalità sola lettura.

Casi d'uso

Riepiloga le chiamate di supporto clienti o identifica comunicazioni potenzialmente non sicure o di bassa qualità. Phrase Studio restituisce un riepilogo e segnala sezioni per la revisione.

Identificazione degli oratori

Rileva e etichetta diversi oratori in un file audio per trascrizioni e sottotitoli più chiari.

L'identificazione automatica degli oratori non è disponibile per progetti con file di sottotitoli importati.

Casi d'uso

Un podcast con più partecipanti viene elaborato e ogni oratore viene automaticamente contrassegnato (ad es., "Oratore 1", "Oratore 2").

Clicca Gestisci oratori nel menu Trascrivi per modificare il nome dell'oratore o aggiungere altri oratori.

Usa l'interruttore Combinato/Oratori in fondo all'editor per passare tra un'unica forma d'onda e forme d'onda individuali per ciascun oratore. Quando vengono rilevati più oratori, i segmenti possono essere trascinati all'interno di una riga per riflettere il discorso sovrapposto, o spostati in un'altra riga per cambiare l'oratore assegnato.