Аудио транскрипция (Студия)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Аудио транскрипция принимает аудио в качестве входных данных и использует автоматическое распознавание речи и автоматическую идентификацию говорящего для генерации текстового результата. В частности, система использует собственный экземпляр системы автоматического распознавания речи OpenAI Whisper.

Моноязычные базы терминов могут быть созданы на странице Настройки, чтобы улучшить точность транскрипции ИИ для специализированных или сложных терминов. Базы терминов автоматически делятся со всеми пользователями одной организации в режиме только для чтения.

Phrase Studio использует Часы локализации видео.

Примеры использования

Интервью с клиентом продолжительностью 45 минут, записанное в виде файла MP4.

Создается текстовая транскрипция с идентификацией говорящих, которая может быть использована для создания кейс-стадии и извлечения цитат для веб-сайта.

Чтобы создать проект аудио транскрипции, выполните следующие шаги:

В Phrase Studio нажмите Новый проект.

Открывается страница Создать новый проект.
Перетащите файл в поле загрузки или нажмите Загрузить файл, чтобы найти файл на вашем компьютере.

Загруженный файл отображается.
При желании укажите количество Говорящих в загруженном файле.
- Чтобы установить количество говорящих вручную, откройте выпадающий список и выберите значение от 1 до 5. Если файл содержит более пяти говорящих, используйте параметр по умолчанию Автоопределение.
Укажите имя проекта и установите видимость проекта по мере необходимости:
- Новые проекты по умолчанию являются публичными. Публичные проекты видны всем пользователям в организации, у которых есть доступ к Студии.
- Снимите выделение с Общего проекта, чтобы создать частный проект, видимый только для владельца проекта. Частный проект все еще может быть поделён с выбранными пользователями, если это необходимо.
Выберите Исходный язык вручную или включите Автоопределение исходного языка для автоматического определения.
При необходимости в разделе Опции локализации включите Перевести субтитры и выберите язык(и), на который(е) будет переведён файл.
- Переводческая система настраивается.
- Если выбрано Дублировать на целевые языки, файл будет транскрибирован, переведён и дублирован немедленно без возможности предварительной проверки перевода.
Выберите Профиль субтитров, чтобы определить правила отображения субтитров.

Включите Использовать разные профили субтитров для конкретных языков, чтобы выбрать профиль для каждого языка.
При желании включите Применить правила произношения для улучшения точности синтеза речи, чтобы выбрать существующие произношения и связанные пары для рабочих процессов дублирования.
При необходимости настройте дополнительные параметры:
- Откройте раздел Субтитры, чтобы импортировать существующие файлы субтитров в формате SRT или VTT для исходного и целевого языков.
  
  Система пропустит автоматическую транскрипцию аудио с идентификацией говорящего и выровняет существующие субтитры с видео. Пользователям необходимо вручную создать и назначить говорящих, так как файлы SRT/VTT не содержат информации о говорящих.
- Откройте раздел Автоматизированный перевод, чтобы переопределить настройки на уровне аккаунта и выбрать предпочитаемую Переводческую систему на уровне проекта.
  - Если выбран Язык фраз ИИ, отображаются выпадающие меню Профиль МТ и Память переводов.
    
    Выберите один из доступных профилей МТ и, при желании, ТМ.
  - Если выбран Агент ИИ-перевода, отображается выпадающее меню Память переводов.
    
    Выберите одну из доступных ТМ.
- Откройте раздел Ресурсы, чтобы выбрать существующую базу терминов или добавить термины, которые будут использоваться для обнаружения и сопоставления схожих по звучанию слов во время транскрипции.
- Откройте раздел Сгенерированные ИИ резюме и инсайты, чтобы выбрать желаемые резюме и инсайты, которые будут сгенерированы для загруженной записи, и соответствующие модели ИИ.
Нажмите Создать проект.

Файл загружен и отображается на странице Мои записи.

Нажмите на название записи, чтобы открыть её в редакторе и просмотреть в вкладках Транскрибировать и Перевод. Оба текста могут быть отредактированы при необходимости.

Нажмите Скачать, чтобы выбрать транскрипцию и переводы для скачивания на вашу систему. Также возможно скачать только аудиотреки в формате MP3.

Итоги ИИ

Извлекает структурированные и значимые данные, такие как резюме, настроение, флаги качества или проблемы безопасности из субтитров с использованием моделей ИИ.

Итоги, созданные на странице Настройки, автоматически делятся со всеми пользователями одной организации в режиме только для чтения.

Примеры использования

Резюмируйте звонки в службу поддержки клиентов или определяйте потенциально небезопасное или низкокачественное общение. Phrase Studio возвращает резюме и помечает разделы для проверки.

Идентификация говорящих

Обнаруживает и маркирует разных говорящих в аудиофайле для более четких транскрипций и субтитров.

Автоматическая идентификация говорящих недоступна для проектов с импортированными файлами субтитров.

Примеры использования

Подкаст с несколькими участниками обрабатывается, и каждый говорящий автоматически помечается (например, "Говорящий 1", "Говорящий 2").

Нажмите Управление говорящими в меню Транскрибировать, чтобы отредактировать имя говорящего или добавить других говорящих.

Используйте переключатель Смешанный/Говорящие внизу редактора, чтобы переключаться между одной волновой формой и индивидуальными волновыми формами для каждого говорящего. Когда обнаруживается несколько говорящих, сегменты могут быть перетаскиваемыми в пределах строки, чтобы отразить перекрывающуюся речь, или перемещены в другую строку, чтобы изменить назначенного говорящего.