Транскрипция аудио принимает аудио в качестве входных данных и использует автоматическое распознавание речи и автоматическую идентификацию говорящего для генерации текстового результата. В частности, система использует собственный экземпляр системы автоматического распознавания речи OpenAI Whisper.
Одноязычные базы терминов могут быть созданы на странице для повышения точности транскрипции ИИ для специализированных или сложных терминов. Базы терминов автоматически делятся со всеми пользователями одной организации в режиме только для чтения.
Phrase Studio использует Часы локализации видео.
Примеры использования
-
Интервью с клиентом продолжительностью 45 минут, записанное в виде файла MP4.
Создается текстовая транскрипция с идентификацией говорящих, которая может быть использована для создания кейс-стадии и извлечения цитат для веб-сайта.
Чтобы создать проект транскрипции аудио, выполните следующие шаги:
-
В Phrase Studio нажмите Новый проект.
Открывается страница .
-
Перетащите файл в поле загрузки или нажмите Загрузить файл, чтобы найти файл на вашем компьютере.
Загруженный файл отображается.
-
При желании укажите количество в загруженном файле.
-
Чтобы установить количество говорящих вручную, откройте выпадающий список и выберите значение от 1 до 5. Если файл содержит более пяти говорящих, используйте параметр по умолчанию .
-
-
Укажите имя проекта и установите видимость проекта по мере необходимости:
-
Новые проекты по умолчанию являются публичными. Публичные проекты видны всем пользователям в организации, у которых есть доступ к Студии.
-
Снимите выделение с , чтобы создать частный проект, видимый только для владельца проекта. Частный проект все еще может быть поделён с выбранными пользователями, если это необходимо.
-
-
Выберите вручную или включите для автоматического определения.
-
Если необходимо, в разделе включите и выберите язык(и), на который(е) будет переведён файл.
-
Переводческая система настраивается.
-
Если выбрано , файл будет транскрибирован, переведён и дублирован немедленно без возможности предварительной проверки перевода.
-
-
Выберите , чтобы определить правила отображения субтитров.
Включите , чтобы выбрать профиль для каждого языка.
-
При необходимости включите , чтобы выбрать существующие произношения и связанные пары для рабочих процессов дублирования.
-
Если необходимо, настройте дополнительные параметры:
-
Откройте раздел , чтобы импортировать существующие файлы субтитров в формате SRT или VTT для исходного и целевого языков.
Система пропустит автоматическую транскрипцию аудио с идентификацией говорящих и выровняет существующие субтитры с видео. Пользователям необходимо вручную создать и назначить говорящих, так как файлы SRT/VTT не содержат информации о говорящих.
-
Откройте раздел , чтобы переопределить настройки на уровне аккаунта и выбрать предпочтительную на уровне проекта.
-
Откройте раздел , чтобы выбрать существующую базу терминов или добавить термины, которые будут использоваться для обнаружения и сопоставления схожих по звучанию слов во время транскрипции.
-
Откройте раздел , чтобы выбрать желаемые резюме и инсайты, которые будут сгенерированы для загруженной записи, и соответствующие модели ИИ.
-
-
Нажмите Создать проект.
Файл загружен и отображается на странице .
Нажмите на название записи, чтобы открыть её в редакторе и просмотреть в вкладках и . Оба текста могут быть отредактированы при необходимости.
Нажмите Скачать, чтобы выбрать транскрипцию и переводы для скачивания на вашу систему. Также возможно скачать аудиотреки только в формате MP3.
Извлекает структурированные и значимые данные, такие как резюме, настроение, флаги качества или проблемы безопасности из субтитров с использованием моделей ИИ.
Данные, созданные на странице , автоматически делятся со всеми пользователями одной организации в режиме только для чтения.
Примеры использования
-
Суммируйте звонки в службу поддержки клиентов или определяйте потенциально небезопасное или низкокачественное общение. Phrase Studio возвращает резюме и помечает разделы для проверки.
Обнаруживает и маркирует различных говорящих в аудиофайле для более четких транскрипций и субтитров.
Автоматическая идентификация говорящих недоступна для проектов с импортированными файлами субтитров.
Примеры использования
-
Подкаст с несколькими участниками обрабатывается, и каждый говорящий автоматически помечается (например, "Говорящий 1", "Говорящий 2").
Нажмите Управление говорящими в меню , чтобы отредактировать имя говорящего или добавить других говорящих.
Используйте переключатель Смешанные/Говорящие внизу редактора, чтобы переключаться между одной волновой формой и индивидуальными волновыми формами для каждого говорящего. Когда обнаруживается несколько говорящих, сегменты могут быть перетаскиваемы в пределах строки, чтобы отразить перекрывающуюся речь, или перемещены в другую строку, чтобы изменить назначенного говорящего.