D3D12 ビデオエンコード

この記事では、Direct3D12 ビデオエンコード機能に関するドライバー開発者向けの一般的な情報を提供します。アプリケーションレベルの詳細を含む詳細については、 D3D ビデオエンコード仕様を参照してください。

Direct3D 12 ビデオエンコードについて

Windows 11 (WDDM 3.0) より前の DirectX 12 では、ビデオデコード、ビデオ処理、モーション推定など、いくつかのビデオアプリケーションの GPU アクセラレーションをサポートするアプリケーションレベルおよびドライバーレベルのインターフェイス (API と DDI) が提供されました。

Windows 11 以降、D3D12 は既存のビデオ API/DDI ファミリにビデオエンコード機能を追加します。この機能は、既存の D3D12 フレームワークと一貫性のある一連のエンコード API/DDI を提供し、開発者は GPU アクセラレータのビデオエンジンを使用してビデオエンコードを実行できます。

ビデオエンコードフレームワークは、ビデオエンコーダーハードウェアアクセラレーション機能へのアクセスを提供します。モノのインターネット (IoT)、クラウド、メディア API、機械学習 (ML)、ゲームストリーミングなど、さまざまなシナリオで使用できます。

AV1 エンコードのサポートは、Windows 11 バージョン 24H2 (WDDM 3.2) で追加されました。詳細については、「 D3D12 AV1 ビデオエンコード」を参照してください。

サポートされているコーデック

Windows 11 以降では、サポートされているコーデックは H.264 と HEVC ですが、D3D12 ビデオエンコードフレームワークは AV1 などの新しいコーデックに対してオープンな拡張性を提供します。

フレームワークのインターフェイスのコーデック固有の側面は、コーデック固有の構造体と共用体の型へのアクセスに委任されます。たとえば、 D3D12DDI_VIDEO_ENCODER_CODEC_CONFIGURATION_0082_0 構造体には、コーデック固有の D3D12DDI_VIDEO_ENCODER_CODEC_CONFIGURATION_H264_0082_0 へのポインターを持つ共用体と、コーデック固有の構成情報を含む D3D12DDI_VIDEO_ENCODER_CODEC_CONFIGURATION_HEVC_0082_0 構造体が含まれます。

拡張に関するバイナリインターフェイスの互換性を維持するために、共用体の型には常にコーデック固有の構造体へのポインターが含まれます。共用体型のサイズは、ホストアーキテクチャのポインターサイズに基づいて一定です。また、この決定により、(または匿名の) 共用体型のメンバーを保持する構造体が、インターフェイスを拡張するときに型のサイズが変更されるのを防ぐことができます。一部の共用体には列挙型へのポインターのみが含まれています。一貫性を保つには、これらの列挙型は、新しいコーデックがそれらの概念を表すために列挙型よりも複雑な型を必要とする場合にも、ポインターとして参照されます。

ビデオ符号化のサポートと機能を報告する

既存のビデオ関連フレームワークは、ドライバーがビデオエンコードのサポートと機能を報告できるように拡張されました。

D3D12DDI_FEATURE_VERSION_VIDEO_0083_0 は、Windows 11 で導入されたすべての D3D12 ビデオエンコードマイルストーンの最初の完全な実装を定義するバージョン番号です。
D3D12DDICAPS_TYPE_VIDEO_0020列挙体は、次のビデオエンコードサポート値を含むように拡張されました。
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_CODEC = 31,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_PROFILE_LEVEL = 32,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_OUTPUT_RESOLUTION_RATIOS_COUNT = 33,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_OUTPUT_RESOLUTION = 34,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_INPUT_FORMAT = 35,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_RATE_CONTROL_MODE = 36,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_INTRA_REFRESH_MODE = 37,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_FRAME_SUBREGION_LAYOUT_MODE = 38,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_HEAP_SIZE = 39,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_CODEC_CONFIGURATION_SUPPORT = 40,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_SUPPORT = 41,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_CODEC_PICTURE_CONTROL_SUPPORT = 42,
- D3D12DDICAPS_TYPE_VIDEO_0080_ENCODER_RESOURCE_REQUIREMENTS = 43
D3D ランタイムは、ドライバーの PFND3D12DDI_VIDEO_GETCAPS コールバックを呼び出して、ビデオエンコードのサポートを照会します。
ビデオエンコードをサポートするドライバーは、D3D ランタイムに、 D3D12DDI_DEVICE_FUNCS_VIDEO_0082_0 構造体内のビデオエンコードコールバック関数へのポインターを提供します。

D3D12 ビデオエンコードコールバック関数

ドライバーは、D3D12 ビデオエンコードをサポートするために、次のコールバック関数を実装します。

ビデオエンコーダーを表すドライバーオブジェクトを作成します。
- PFND3D12DDI_CALCPRIVATEVIDEOENCODERSIZE_0082_0 は、D3D ランタイムがドライバーオブジェクトに割り当てる必要があるメモリの量を計算します。
- PFND3D12DDI_CREATEVIDEOENCODER_0082_0 は、ビデオエンコードセッションの状態を保持する実際のビデオエンコーダーオブジェクトを作成します。
ビデオエンコーダーヒープを表すドライバーオブジェクトを作成します。
- PFND3D12DDI_CALCPRIVATEVIDEOENCODERHEAPSIZE_0080_2 は、D3D ランタイムがドライバーオブジェクトに割り当てる必要があるメモリの量を計算します。
- PFND3D12DDI_CREATEVIDEOENCODERHEAP_0080_2 は、解像度に依存するドライバーリソースと状態を含むビデオエンコーダーヒープオブジェクトを作成します。
フレームをエンコードする:
- PFND3D12DDI_VIDEO_ENCODE_FRAME_0082_0 は、エンコードフレーム操作をコマンドリストに記録します。
- エンコード操作の後、 エンコード操作の 出力メタデータを読み取り可能な形式に解決するには、PFND3D12DDI_VIDEO_ENCODE_RESOLVE_OUTPUT_METADATA_0082_0も呼び出す必要があります。ドライバーの解決されたメタデータのレイアウトは、仕様の図に示されている例に似ています。
ビデオエンコーダーと関連するヒープを破棄します。
- PFND3D12DDI_DESTROYVIDEOENCODER_0080
- PFND3D12DDI_DESTROYVIDEOENCODERHEAP_0080

テスティング

次のテストは、 Windows ハードウェアラボキット (WHLK) の一部として含まれています。詳細については WHLK を参照してください。

テスト名	説明
CreateVideoEncoder	報告された CheckFeatureSupport 関連のケースに基づいて、VideoEncoder/VideoEncoderHeap の作成を検証します。
SingleEncodeH264/HEVC	構造イメージの基本チェックのための QR コードベースのテスト。入力画像シーケンスには、定義済みの QR コンテンツがスタンプされ、エンコードおよびデコードされます。最後に、出力値 (およびある程度は品質) がチェックされ、期待どおりであることを確認します。
EncodeProfileLevelSuggestionsH264/HEVC (エンコードプロファイルレベルの提案H264/HEVC)	D3D12_FEATURE_DATA_VIDEO_ENCODER_SUPPORT の SuggestedProfile/Level の値が、H.264/HEVC の仕様および D3D12_FEATURE_DATA_VIDEO_ENCODER_SUPPORT に入力として渡される構成に基づき、期待される通りであることを検証することを確認します。
EncodeHeapSizeCap	異なる増加する入力引数でメモリ占有領域の増加を検証します。
SimpleGOPEncodeH264/HEVC(10 ビット)	さまざまな解像度、GOP パターン、スライスモード、および他のコーデック構成を使用して入力ビデオをトランスコードし、出力されたエンコード済みビデオを入力ビデオストリームとの差が許容範囲内であることを確認します。この比較は、ピーク信号対ノイズ比 (PSNR) を使用して行われます。
EncodeSubregions/ResolutionReconfiguration	その場で再構成を検証します。
EncodeH264LongTermReferences	長期的な画像参照の使用を検証します。
EncodeIntraRefresh	オープン IPP...P...P...GOP を使用して、イントラリフレッシュの単純なシナリオを検証します。
ビデオエンコードコマンドリスト機能	ビデオエンコードコマンドリストのプレディケーションとマーカーを検証します。
ビデオエンコードタイムスタンプ	ビデオエンコードコマンドリストのタイムスタンプを検証します。

ビデオエンコードのシナリオ

OneCore

D3D12 ビデオエンコードのサポートにより、D3D12 のみが使用可能なプラットフォームで、ハードウェアで高速化されたポータブルビデオエンコードが可能になります。これらのプラットフォームには、クラウドコンピューティングと IoT プラットフォームで使用されるさまざまな OneCore SKU が含まれます。ビデオエンコードアクセラレーションは、プラットフォーム固有のソリューションを使用する必要なく、これらのシナリオで使用できます。

メディア API

低レベルでポータブルな方法で、すべてのハードウェアベンダーでビデオエンコード機能にアクセス可能です。このアクセシビリティにより、より高いレベルのメディア API (Media Foundation など) は、さまざまなハードウェアプラットフォームの抽象化を処理するこの API の上にメディアレイヤーを構築できます。 API の低レベル設計を考えると、これらの上位レベルのメディアレイヤーは、ビデオエンコードセッションの同期とメモリの割り当て/常駐の側面 (参照画像管理の完全な制御やビットストリームヘッダーの書き込み責任など) を細かく制御することで、シナリオに合わせて最適化できます。この API の上にあるレイヤーへのこの責任の移行により、ハードウェアベンダーは、異なるハードウェアプラットフォーム間で再利用できる一貫したエンコードポリシー (たとえば、アダプティブ GOP などの DPB ヒューリスティック) をメディアレイヤー内に持つことができます。

D3D グラフィックス、コンピューティング、機械学習との相互運用性

D3D12 ビデオエンコード API を使用すると、D3D12 ビデオエンコードと D3D12 グラフィックス、コンピューティング、ML のシナリオ間の効率的な相互運用性を実現できます。この相互運用性は、カメラストリームで ML 推論を実行するなどのシナリオで興味深いものです。

ゲームストリーミングシナリオ

D3D12 ビデオエンコード API を使用すると、パフォーマンスの高い低レベル API を必要とするゲームストリーミングシナリオが可能になります。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-07-18

次の方法で共有

D3D12 ビデオ エンコード

Direct3D 12 ビデオ エンコードについて