오디오 전사 (스튜디오)

컨텐츠는 영어 텍스트를 Phrase Language AI를 이용해 기계 번역한 것입니다.

오디오 전사는 오디오를 입력으로 받아 자동 음성 인식 및 자동 화자 식별을 사용하여 텍스트 출력을 생성합니다. 특히, 시스템은 OpenAI Whisper 자동 음성 인식 시스템의 독점 인스턴스를 사용합니다.

전문적이거나 어려운 용어에 대한 AI 전사 정확성을 향상시키기 위해 설정 페이지에서 단일 언어 용어 기반을 생성할 수 있습니다. 용어 기반은 읽기 전용 모드로 동일한 조직의 모든 사용자와 자동으로 공유됩니다.

Phrase Studio는 비디오 현지화 시간을 소비합니다.

사용 사례

45분 고객 인터뷰가 MP4 파일로 기록됩니다.

화자 식별이 포함된 텍스트 전사가 생성되어 사례 연구를 만들고 웹사이트에 인용을 끌어내는 데 사용될 수 있습니다.

오디오 전사 프로젝트를 생성하려면 다음 단계를 따르십시오:

Phrase Studio에서 새 프로젝트를 클릭합니다.

새 프로젝트 만들기 페이지가 열립니다.
파일을 업로드 필드에 드래그하거나 파일 업로드를 클릭하여 시스템에서 파일을 찾습니다.

업로드된 파일이 표시됩니다.
선택적으로 업로드된 파일의 화자 수를 지정합니다.
- 화자 수를 수동으로 설정하려면 드롭다운을 열고 1에서 5까지의 값을 선택합니다. 파일에 다섯 명 이상의 화자가 포함된 경우 기본 자동 감지 옵션을 사용하십시오.
프로젝트 이름을 제공하고 필요에 따라 프로젝트 가시성을 설정합니다:
- 새 프로젝트는 기본적으로 공개입니다. 공개 프로젝트는 스튜디오에 접근할 수 있는 조직의 모든 사용자에게 표시됩니다.
- 공개 프로젝트 Public project의 선택을 해제하여 프로젝트 소유자에게만 보이는 개인 프로젝트를 생성합니다. 필요한 경우 개인 프로젝트는 선택된 사용자와 공유할 수 있습니다.
수동으로 Source Language을 선택하거나 자동 감지를 위해 Auto-detect source language를 활성화합니다.
필요한 경우 Localization Options에서 Translate subtitles를 활성화하고 번역할 파일의 언어를 선택합니다.
- translation engine은 구성 가능합니다.
- Dub into target languages이 선택되면 파일이 전사되고 번역되며 dubbed되어 사전 번역 확인 기회가 없습니다.
자막 표시 규칙을 결정하기 위해 Subtitle profile을 선택합니다.

특정 언어에 대해 다른 자막 프로필을 사용하도록 Use different subtitle profiles for specific languages을 활성화하여 각 언어에 대한 프로필을 선택합니다.
선택적으로, 텍스트-음성 정확도를 개선하기 위해 Apply pronunciation rules to improve text-to-speech accuracy을 활성화하여 더빙 작업 흐름을 위한 기존 pronunciations 및 관련 쌍을 선택합니다.
필요한 경우 추가 옵션을 구성합니다:
- 기존 자막 파일을 SRT 또는 VTT 형식으로 가져오기 위해 Subtitles 섹션을 엽니다.
  
  시스템은 화자 식별이 있는 자동 오디오 전사를 건너뛰고 기존 자막을 비디오와 정렬합니다. SRT/VTT 파일에는 화자 정보가 포함되어 있지 않으므로 사용자가 수동으로 화자를 생성하고 할당해야 합니다.
- 계정 수준 설정을 무시하고 프로젝트 수준에서 선호하는 Translation engine을 선택하기 위해 Automated translation 섹션을 엽니다.
  - Phrase Language AI이 선택되면 MT Profile 및 Translation Memory 드롭다운 메뉴가 표시됩니다.
    
    사용 가능한 MT 프로필 중 하나와 선택적으로 TM을 선택합니다.
  - AI Translation Agent이 선택되면 Translation Memory 드롭다운 메뉴가 표시됩니다.
    
    사용 가능한 TM 중 하나를 선택합니다.
- 기존 용어 데이터베이스를 선택하거나 전사 중 유사한 발음을 감지하고 일치시키는 데 사용할 용어를 추가하기 위해 Resources 섹션을 엽니다.
- 업로드된 녹음에 대해 생성될 원하는 요약 및 통찰력을 선택하기 위해 AI-generated summaries and insights 섹션을 엽니다.
클릭 프로젝트 생성.

파일이 업로드되어 내 녹음 페이지에 표시됩니다.

녹음 이름을 클릭하여 편집기에서 열고 전사 및 번역 탭에서 확인하세요. 필요한 경우 두 텍스트를 편집할 수 있습니다.

클릭 다운로드하여 전사 및 번역을 선택하여 시스템에 다운로드합니다. MP3 형식으로 오디오 전용 트랙을 다운로드하는 것도 가능합니다.

AI 요약

AI 모델을 사용하여 자막에서 요약, 감정, 품질 플래그 또는 안전 문제와 같은 구조적이고 의미 있는 통찰력을 추출합니다.

설정 페이지에서 생성된 통찰력은 동일한 조직의 모든 사용자와 읽기 전용 모드로 자동 공유됩니다.

사용 사례

고객 지원 전화를 요약하거나 잠재적으로 안전하지 않거나 저품질의 커뮤니케이션을 식별합니다. Phrase Studio는 요약을 반환하고 검토를 위해 섹션에 플래그를 지정합니다.

화자 식별

오디오 파일에서 서로 다른 화자를 감지하고 레이블을 지정하여 더 명확한 전사 및 자막을 제공합니다.

가져온 자막 파일이 있는 프로젝트에서는 자동 화자 식별이 제공되지 않습니다.

사용 사례

여러 참가자가 있는 팟캐스트가 처리되며 각 화자는 자동으로 태그가 지정됩니다(예: "화자 1", "화자 2").

편집기 하단의 화자 관리를 클릭하여 화자 이름을 편집하거나 다른 화자를 추가합니다.

편집기 하단의 결합/화자 토글을 사용하여 단일 파형과 각 화자에 대한 개별 파형 간에 전환합니다. 여러 화자가 감지되면, 겹치는 발화를 반영하기 위해 행 내에서 세그먼트를 드래그하거나 할당된 화자를 변경하기 위해 다른 행으로 이동할 수 있습니다.