Windows Media 오디오 음성 코덱은 음성을 포함하는 오디오에 최적화된 낮은 비트 전송률 압축을 제공합니다. 이러한 작은 샘플을 생성하는 코덱의 능력은 인간의 목소리의 소리의 제한된 주파수 범위 때문입니다. 이 최적화는 전용 음성 인코더가 음악과 같이 더 복잡한 소리를 포함하는 콘텐츠에 대해 품질이 낮은 출력을 생성한다는 것을 의미합니다. 그러나 Windows Media Audio Voice 코덱은 음성, 음악 및 혼합 콘텐츠에 대해 별도의 모드를 제공하여 이러한 잠재적 품질 문제를 보완합니다. 코덱은 혼합 콘텐츠를 분석하여 파일의 각 부분에 사용할 모드를 결정합니다.
Windows Media Audio Voice 코덱은 클래스 식별자 CLSID_CWMSPEncMediaObject2 의해 식별되는 인코더 개체 및 클래스 식별자 CLSID_CWMSPDecMediaObject 의해 식별되는 디코더 개체에서 구현됩니다. 이 코덱을 사용하는 미디어 형식의 형식 태그는 0x00A.
인코더 구성
음성 인코더는 음성, 음악 및 혼합의 세 가지 모드를 지원합니다. 각 모드는 해당 유형의 콘텐츠에 대한 최상의 결과를 얻기 위해 최적화됩니다. IPropertyStore 메서드를 사용하여 음성 인코더의 모드를 구성하여 MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode 속성을 설정할 수 있습니다.
혼합 콘텐츠에 대해 구성된 경우 Windows Media Audio Voice 코덱은 콘텐츠의 음악 구절을 자동으로 검색합니다. 결과에 만족하지 않는 경우 편집 결정 목록(EDL)을 사용하여 콘텐츠에서 음악의 위치를 지정할 수 있습니다. 자세한 내용은 음성 인코딩을 위한 편집 결정 목록 사용 을 참조하세요.
다른 오디오 인코더와 달리 MFPKEY_WMAVOICE_ENC_BufferWindow 속성을 사용하여 음성 콘텐츠에 대한 버퍼 창 값을 설정할 수 있습니다. 그러나 대부분의 경우 기본값이 제대로 작동해야 합니다.
메모
음성 인코더를 구성할 때 입력 형식을 설정하기 전에 출력 형식을 설정하는 것이 매우 중요합니다. 이는 모든 오디오 코덱에 권장되는 작업 순서이지만 IMediaObject::GetOutputType 또는IMFTransform::GetOutputType호출할 때 입력이 설정된 경우 음성 인코더가 잘못된 출력 형식을 보고할 수 있습니다.
디코딩
음성 오디오 디코딩에 대한 특별한 요구 사항은 없습니다. 자세한 정보를 원하시면, 오디오 디코딩 구성을 참조하세요.
관련 항목