Аудио транскрипция принимает аудио в качестве входных данных и использует автоматическое распознавание речи и автоматическую идентификацию говорящего для генерации текстового результата. В частности, система использует собственный экземпляр системы автоматического распознавания речи OpenAI Whisper.
Моноязычные базы терминов могут быть созданы на странице , чтобы улучшить точность транскрипции ИИ для специализированных или сложных терминов. Базы терминов автоматически делятся со всеми пользователями одной организации в режиме только для чтения.
Phrase Studio использует Часы локализации видео.
Примеры использования
-
Интервью с клиентом продолжительностью 45 минут, записанное в виде файла MP4.
Создается текстовая транскрипция с идентификацией говорящих, которая может быть использована для создания кейс-стадии и извлечения цитат для веб-сайта.
Чтобы создать проект аудио транскрипции, выполните следующие шаги:
-
В Phrase Studio нажмите Новый проект.
Открывается страница .
-
Перетащите файл в поле загрузки или нажмите Загрузить файл, чтобы найти файл на вашем компьютере.
Загруженный файл отображается.
-
При желании укажите количество в загруженном файле.
-
Чтобы установить количество говорящих вручную, откройте выпадающий список и выберите значение от 1 до 5. Если файл содержит более пяти говорящих, используйте параметр по умолчанию .
-
-
Укажите имя проекта и установите видимость проекта по мере необходимости:
-
Новые проекты по умолчанию являются публичными. Публичные проекты видны всем пользователям в организации, у которых есть доступ к Студии.
-
Снимите выделение с , чтобы создать частный проект, видимый только для владельца проекта. Частный проект все еще может быть поделён с выбранными пользователями, если это необходимо.
-
-
Выберите вручную или включите для автоматического определения.
-
При необходимости в разделе включите и выберите язык(и), на который(е) будет переведён файл.
-
Переводческая система настраивается.
-
Если выбрано , файл будет транскрибирован, переведён и дублирован немедленно без возможности предварительной проверки перевода.
-
-
Выберите , чтобы определить правила отображения субтитров.
Включите , чтобы выбрать профиль для каждого языка.
-
При желании включите , чтобы выбрать существующие произношения и связанные пары для рабочих процессов дублирования.
-
При необходимости настройте дополнительные параметры:
-
Откройте раздел , чтобы импортировать существующие файлы субтитров в формате SRT или VTT для исходного и целевого языков.
Система пропустит автоматическую транскрипцию аудио с идентификацией говорящего и выровняет существующие субтитры с видео. Пользователям необходимо вручную создать и назначить говорящих, так как файлы SRT/VTT не содержат информации о говорящих.
-
Откройте раздел , чтобы переопределить настройки на уровне аккаунта и выбрать предпочитаемую на уровне проекта.
-
Откройте раздел , чтобы выбрать существующую базу терминов или добавить термины, которые будут использоваться для обнаружения и сопоставления схожих по звучанию слов во время транскрипции.
-
Откройте раздел , чтобы выбрать желаемые резюме и инсайты, которые будут сгенерированы для загруженной записи, и соответствующие модели ИИ.
-
-
Нажмите Создать проект.
Файл загружен и отображается на странице .
Нажмите на название записи, чтобы открыть её в редакторе и просмотреть в вкладках и . Оба текста могут быть отредактированы при необходимости.
Нажмите Скачать, чтобы выбрать транскрипцию и переводы для скачивания на вашу систему. Также возможно скачать только аудиотреки в формате MP3.
Извлекает структурированные и значимые данные, такие как резюме, настроение, флаги качества или проблемы безопасности из субтитров с использованием моделей ИИ.
Итоги, созданные на странице , автоматически делятся со всеми пользователями одной организации в режиме только для чтения.
Примеры использования
-
Резюмируйте звонки в службу поддержки клиентов или определяйте потенциально небезопасное или низкокачественное общение. Phrase Studio возвращает резюме и помечает разделы для проверки.
Обнаруживает и маркирует разных говорящих в аудиофайле для более четких транскрипций и субтитров.
Автоматическая идентификация говорящих недоступна для проектов с импортированными файлами субтитров.
Примеры использования
-
Подкаст с несколькими участниками обрабатывается, и каждый говорящий автоматически помечается (например, "Говорящий 1", "Говорящий 2").
Нажмите Управление говорящими в меню , чтобы отредактировать имя говорящего или добавить других говорящих.
Используйте переключатель Смешанный/Говорящие внизу редактора, чтобы переключаться между одной волновой формой и индивидуальными волновыми формами для каждого говорящего. Когда обнаруживается несколько говорящих, сегменты могут быть перетаскиваемыми в пределах строки, чтобы отразить перекрывающуюся речь, или перемещены в другую строку, чтобы изменить назначенного говорящего.