Audio-Transkription (Studio)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Die Audio-Transkription nimmt Audio als Eingabe und verwendet automatisierte Spracherkennung und automatisierte Sprecheridentifikation, um Textausgaben zu generieren. Konkret verwendet das System eine proprietäre Instanz des OpenAI Whisper-Systems zur automatisierten Spracherkennung.

Einsprachige Terminologiedatenbanken können auf der Einstellungen-Seite erstellt werden, um die Genauigkeit der KI-Transkription für spezialisierte oder schwierige Begriffe zu verbessern. Terminologiedatenbanken werden automatisch im schreibgeschützten Modus mit allen Benutzern derselben Organisation geteilt.

Phrase Studio verbraucht Video-Lokalisierungsstunden.

Anwendungsfälle

Ein 45-minütiges Kundeninterview, das als MP4-Datei aufgezeichnet wurde.

Ein Texttranskript wird mit Sprecheridentifikation erstellt, das verwendet werden kann, um eine Fallstudie zu erstellen und Zitate für eine Website zu entnehmen.

Um ein Audio-Transkriptionsprojekt zu erstellen, befolgen Sie diese Schritte:

Klicken Sie in Phrase Studio auf Neues Projekt.

Die Neues Projekt erstellen-Seite öffnet sich.
Ziehen Sie entweder eine Datei in das Upload-Feld oder klicken Sie auf Datei hochladen, um eine Datei auf Ihrem System zu finden.

Die hochgeladene Datei wird angezeigt.
Optional können Sie die Anzahl der Sprecher in der hochgeladenen Datei angeben.
- Um die Anzahl der Sprecher manuell festzulegen, öffnen Sie das Dropdown-Menü und wählen Sie einen Wert von 1 bis 5 aus. Wenn die Datei mehr als fünf Sprecher enthält, verwenden Sie die Standardoption Automatisch erkennen.
Geben Sie einen Namen für das Projekt an und legen Sie die Sichtbarkeit des Projekts nach Bedarf fest:
- Neue Projekte sind standardmäßig öffentlich. Öffentliche Projekte sind für alle Benutzer in der Organisation sichtbar, die Zugriff auf das Studio haben.
- Deaktivieren Sie Öffentliches Projekt, um ein privates Projekt zu erstellen, das nur für den Projektinhaber sichtbar ist. Ein privates Projekt kann bei Bedarf weiterhin mit ausgewählten Benutzern geteilt werden.
Wählen Sie manuell die Ausgangssprache aus oder aktivieren Sie Automatische Erkennung der Ausgangssprache zur automatischen Erkennung.
Falls erforderlich, aktivieren Sie unter Lokalisierungsoptionen Untertitel übersetzen und wählen Sie die Sprache(n) aus, in die die Datei übersetzt werden soll.
- Die Übersetzungs-Engine ist konfigurierbar.
- Wenn In Zielsprache synchronisieren ausgewählt ist, wird die Datei transkribiert, übersetzt und synchronisiert, ohne die Möglichkeit, die Übersetzung vorher zu überprüfen.
Wählen Sie ein Untertitelprofil aus, um die Regeln für die Anzeige von Untertiteln festzulegen.

Aktivieren Sie Verwenden Sie unterschiedliche Untertitelprofile für spezifische Sprachen, um ein Profil für jede Sprache auszuwählen.
Optional können Sie Ausspracheregeln anwenden, um die Text-zu-Sprache-Genauigkeit zu verbessern aktivieren, um vorhandene Aussprachen und verwandte Paare für Synchronisations-Workflows auszuwählen.
Falls erforderlich, konfigurieren Sie zusätzliche Optionen:
- Öffnen Sie den Untertitel-Bereich, um vorhandene Untertiteldateien im SRT- oder VTT-Format für sowohl Ausgangs- als auch Zielsprache zu importieren.
  
  Das System überspringt die automatische Audio-Transkription mit Sprecheridentifikation und passt die vorhandenen Untertitel an das Video an. Benutzer müssen Sprecher manuell erstellen und zuweisen, da SRT/VTT-Dateien keine Sprecherinformationen enthalten.
- Öffnen Sie den Automatisierte Übersetzung-Bereich, um die kontobezogenen Einstellungen zu überschreiben und die bevorzugte Übersetzungs-Engine auf Projektebene auszuwählen.
  - Wenn Phrase Language AI ausgewählt ist, werden die Dropdown-Menüs für MT-Profil und Übersetzungsspeicher angezeigt.
    
    Wählen Sie eines der verfügbaren MT-Profile und optional ein TM aus.
  - Wenn KI-Übersetzungsagent ausgewählt ist, wird das Dropdown-Menü für Übersetzungsspeicher angezeigt.
    
    Wählen Sie eines der verfügbaren TMs aus.
- Öffnen Sie den Ressourcen-Bereich, um eine vorhandene Termbank auszuwählen oder Begriffe hinzuzufügen, die verwendet werden, um ähnlich klingende Wörter während der Transkription zu erkennen und zuzuordnen.
- Öffnen Sie den KI-generierte Zusammenfassungen und Einblicke-Bereich, um die gewünschten Zusammenfassungen und Einblicke auszuwählen, die für die hochgeladene Aufnahme generiert werden, sowie die relevanten KI-Modelle.
Klicken Sie Projekt erstellen.

Die Datei wird hochgeladen und auf der Meine Aufnahmen Seite angezeigt.

Klicken Sie auf den Aufnahmetitel, um ihn im Editor zu öffnen und in den Transkribieren und Übersetzung Tabs anzuzeigen. Beide Texte können bei Bedarf bearbeitet werden.

Klicken Sie Herunterladen, um die Transkription und die Übersetzungen zum Herunterladen auf Ihr System auszuwählen. Es ist auch möglich, nur Audiospuren im MP3-Format herunterzuladen.

KI-Zusammenfassungen

Extrahiert strukturierte und bedeutungsvolle Erkenntnisse wie Zusammenfassungen, Stimmungen, Qualitätskennzeichen oder Sicherheitsprobleme aus Untertiteln mithilfe von KI-Modellen.

Erkenntnisse, die auf der Einstellungen Seite erstellt wurden, werden automatisch mit allen Benutzern derselben Organisation im schreibgeschützten Modus geteilt.

Anwendungsfälle

Fassen Sie Kundenservice-Anrufe zusammen oder identifizieren Sie potenziell unsichere oder qualitativ minderwertige Kommunikation. Phrase Studio gibt eine Zusammenfassung zurück und kennzeichnet Abschnitte zur Überprüfung.

Sprecheridentifikation

Erkennt und kennzeichnet verschiedene Sprecher in einer Audiodatei für klarere Transkripte und Untertitel.

Die automatische Sprecheridentifikation ist nicht verfügbar für Projekte mit importierten Untertiteldateien.

Anwendungsfälle

Ein Podcast mit mehreren Teilnehmern wird verarbeitet und jeder Sprecher wird automatisch gekennzeichnet (z. B. "Sprecher 1", "Sprecher 2").

Klicken Sie Sprecher verwalten im Transkribieren Menü, um den Namen des Sprechers zu bearbeiten oder andere Sprecher hinzuzufügen.

Verwenden Sie den Kombiniert/Sprecher Schalter am unteren Ende des Editors, um zwischen einer einzelnen Wellenform und einzelnen Wellenformen für jeden Sprecher zu wechseln. Wenn mehrere Sprecher erkannt werden, können Segmente innerhalb einer Zeile verschoben werden, um überlappende Sprache widerzuspiegeln, oder in eine andere Zeile verschoben werden, um den zugewiesenen Sprecher zu ändern.