Korzystanie z kodeka Windows Media Audio Voice

Koder dekodera Audio Voice systemu Windows Media zapewnia kompresję o niskiej szybkości bitów zoptymalizowaną pod kątem dźwięku zawierającego mowę. Zdolność kodera do tworzenia takich małych próbek jest spowodowana ograniczonym zakresem częstotliwości dźwięków głosu ludzkiego. Ta optymalizacja oznacza, że dedykowany koder głosowy tworzy słabej jakości dane wyjściowe zawartości zawierającej bardziej skomplikowane dźwięki, takie jak muzyka. Jednak koder dekodera Audio Voice w systemie Windows Media rekompensuje ten potencjalny problem z jakością, zapewniając oddzielne tryby głosu, muzyki i zawartości mieszanej. Koder kodujący analizuje mieszaną zawartość, aby określić, który tryb ma być używany dla każdej części pliku.

Koder Audio Voice systemu Windows Media jest implementowany w obiekcie kodera zidentyfikowanym przez identyfikator klasy CLSID_CWMSPEncMediaObject2, a w obiekcie dekodera zidentyfikowanym przez identyfikator klasy CLSID_CWMSPDecMediaObject. Tag formatu typów multimediów korzystających z tego kodera jest 0x00A.

Konfigurowanie kodera

Koder głosowy obsługuje trzy tryby: mowę, muzykę i mieszane. Każdy tryb jest zoptymalizowany pod kątem uzyskania najlepszych wyników dla tego typu zawartości. Tryb kodera głosowego można skonfigurować przy użyciu metod IPropertyStore, aby ustawić właściwość MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode.

Po skonfigurowaniu pod kątem zawartości mieszanej koder Windows Media Audio Voice automatycznie wykryje fragmenty muzyki w zawartości. Jeśli wyniki nie są zadowalające, możesz określić lokalizację muzyki w zawartości przy użyciu listy decyzji edycji (EDL). Aby uzyskać więcej informacji, zobacz Używanie listy decyzji do edytowania kodowania głosu.

W przeciwieństwie do innych koderów audio można ustawić wartość okna buforu dla zawartości głosowej przy użyciu właściwości MFPKEY_WMAVOICE_ENC_BufferWindow. Jednak wartości domyślne powinny działać prawidłowo w większości przypadków.

Notatka

Podczas konfigurowania kodera głosowego bardzo ważne jest, aby ustawić typ danych wyjściowych przed ustawieniem typu wejściowego. To jest zalecana kolejność operacji dla wszystkich kodeków audio, ale koder głosu może zgłaszać błędne typy wyjściowe, jeśli ustawiono wejście podczas wywoływania IMediaObject::GetOutputType lub IMFTransform::GetOutputType.

Dekodowanie

Nie ma specjalnych wymagań dotyczących dekodowania dźwięku głosowego. Aby uzyskać więcej informacji, zobacz Konfigurowanie dekodowania dźwięku.

Praca z dźwiękiem

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-03-21

Udostępnij przez

Korzystanie z kodeka Windows Media Audio Voice

Konfigurowanie kodera

Dekodowanie

Tematy pokrewne

Sprzężenie zwrotne

Dodatkowe źródła