Die Audio-Transkription nimmt Audio als Eingabe und verwendet automatisierte Spracherkennung und automatisierte Sprecheridentifikation, um Textausgaben zu generieren. Konkret verwendet das System eine proprietäre Instanz des OpenAI Whisper-Systems zur automatisierten Spracherkennung.
Einsprachige Terminologiedatenbanken können auf der -Seite erstellt werden, um die Genauigkeit der KI-Transkription für spezialisierte oder schwierige Begriffe zu verbessern. Terminologiedatenbanken werden automatisch im schreibgeschützten Modus mit allen Benutzern derselben Organisation geteilt.
Phrase Studio verbraucht Video-Lokalisierungsstunden.
Anwendungsfälle
-
Ein 45-minütiges Kundeninterview, das als MP4-Datei aufgezeichnet wurde.
Ein Texttranskript wird mit Sprecheridentifikation erstellt, das verwendet werden kann, um eine Fallstudie zu erstellen und Zitate für eine Website zu entnehmen.
Um ein Audio-Transkriptionsprojekt zu erstellen, befolgen Sie diese Schritte:
-
Klicken Sie in Phrase Studio auf Neues Projekt.
Die -Seite öffnet sich.
-
Ziehen Sie entweder eine Datei in das Upload-Feld oder klicken Sie auf Datei hochladen, um eine Datei auf Ihrem System zu finden.
Die hochgeladene Datei wird angezeigt.
-
Optional können Sie die Anzahl der in der hochgeladenen Datei angeben.
-
Um die Anzahl der Sprecher manuell festzulegen, öffnen Sie das Dropdown-Menü und wählen Sie einen Wert von 1 bis 5 aus. Wenn die Datei mehr als fünf Sprecher enthält, verwenden Sie die Standardoption .
-
-
Geben Sie einen Namen für das Projekt an und legen Sie die Sichtbarkeit des Projekts nach Bedarf fest:
-
Neue Projekte sind standardmäßig öffentlich. Öffentliche Projekte sind für alle Benutzer in der Organisation sichtbar, die Zugriff auf das Studio haben.
-
Deaktivieren Sie , um ein privates Projekt zu erstellen, das nur für den Projektinhaber sichtbar ist. Ein privates Projekt kann bei Bedarf weiterhin mit ausgewählten Benutzern geteilt werden.
-
-
Wählen Sie manuell die aus oder aktivieren Sie zur automatischen Erkennung.
-
Falls erforderlich, aktivieren Sie unter und wählen Sie die Sprache(n) aus, in die die Datei übersetzt werden soll.
-
Die Übersetzungs-Engine ist konfigurierbar.
-
Wenn ausgewählt ist, wird die Datei transkribiert, übersetzt und synchronisiert, ohne die Möglichkeit, die Übersetzung vorher zu überprüfen.
-
-
Wählen Sie ein aus, um die Regeln für die Anzeige von Untertiteln festzulegen.
Aktivieren Sie , um ein Profil für jede Sprache auszuwählen.
-
Optional können Sie aktivieren, um vorhandene Aussprachen und verwandte Paare für Synchronisations-Workflows auszuwählen.
-
Falls erforderlich, konfigurieren Sie zusätzliche Optionen:
-
Öffnen Sie den -Bereich, um vorhandene Untertiteldateien im SRT- oder VTT-Format für sowohl Ausgangs- als auch Zielsprache zu importieren.
Das System überspringt die automatische Audio-Transkription mit Sprecheridentifikation und passt die vorhandenen Untertitel an das Video an. Benutzer müssen Sprecher manuell erstellen und zuweisen, da SRT/VTT-Dateien keine Sprecherinformationen enthalten.
-
Öffnen Sie den -Bereich, um die kontobezogenen Einstellungen zu überschreiben und die bevorzugte auf Projektebene auszuwählen.
-
Öffnen Sie den -Bereich, um eine vorhandene Termbank auszuwählen oder Begriffe hinzuzufügen, die verwendet werden, um ähnlich klingende Wörter während der Transkription zu erkennen und zuzuordnen.
-
Öffnen Sie den -Bereich, um die gewünschten Zusammenfassungen und Einblicke auszuwählen, die für die hochgeladene Aufnahme generiert werden, sowie die relevanten KI-Modelle.
-
-
Klicken Sie Projekt erstellen.
Die Datei wird hochgeladen und auf der Seite angezeigt.
Klicken Sie auf den Aufnahmetitel, um ihn im Editor zu öffnen und in den und Tabs anzuzeigen. Beide Texte können bei Bedarf bearbeitet werden.
Klicken Sie Herunterladen, um die Transkription und die Übersetzungen zum Herunterladen auf Ihr System auszuwählen. Es ist auch möglich, nur Audiospuren im MP3-Format herunterzuladen.
Extrahiert strukturierte und bedeutungsvolle Erkenntnisse wie Zusammenfassungen, Stimmungen, Qualitätskennzeichen oder Sicherheitsprobleme aus Untertiteln mithilfe von KI-Modellen.
Erkenntnisse, die auf der Seite erstellt wurden, werden automatisch mit allen Benutzern derselben Organisation im schreibgeschützten Modus geteilt.
Anwendungsfälle
-
Fassen Sie Kundenservice-Anrufe zusammen oder identifizieren Sie potenziell unsichere oder qualitativ minderwertige Kommunikation. Phrase Studio gibt eine Zusammenfassung zurück und kennzeichnet Abschnitte zur Überprüfung.
Erkennt und kennzeichnet verschiedene Sprecher in einer Audiodatei für klarere Transkripte und Untertitel.
Die automatische Sprecheridentifikation ist nicht verfügbar für Projekte mit importierten Untertiteldateien.
Anwendungsfälle
-
Ein Podcast mit mehreren Teilnehmern wird verarbeitet und jeder Sprecher wird automatisch gekennzeichnet (z. B. "Sprecher 1", "Sprecher 2").
Klicken Sie Sprecher verwalten im Menü, um den Namen des Sprechers zu bearbeiten oder andere Sprecher hinzuzufügen.
Verwenden Sie den Kombiniert/Sprecher Schalter am unteren Ende des Editors, um zwischen einer einzelnen Wellenform und einzelnen Wellenformen für jeden Sprecher zu wechseln. Wenn mehrere Sprecher erkannt werden, können Segmente innerhalb einer Zeile verschoben werden, um überlappende Sprache widerzuspiegeln, oder in eine andere Zeile verschoben werden, um den zugewiesenen Sprecher zu ändern.