次の方法で共有


Delta Lake におけるバリアントのサポート

重要

この機能はパブリック プレビュー段階にあります。

VARIANT データ型を使用して、半構造化データを Delta Lake に格納できます。 VARIANT の使用例については、「クエリ バリアント データ」を参照してください。

バリアント サポートが有効になっているテーブルの読み取りと書き込みを行うには、Databricks Runtime 15.3 以降を使用する必要があります。

Delta テーブルでバリアントを有効にする

バリアント型を有効にするには、 VARIANT 型の列を含む新しいテーブルを作成します。次に例を示します。

CREATE TABLE table_name (variant_column VARIANT)

次の構文を使用して、既存のテーブルで VARIANT のサポートを有効にすることもできます。

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

警告

バリアントを有効にすると、テーブル プロトコルがアップグレードされます。 アップグレード後、バリアントをサポートしていない Delta Lake クライアントはテーブルを読み取りできなくなります。 Delta Lake の機能の互換性とプロトコルに関する記事を参照してください。

制限事項

次の制限があります。

  • バリアント列を使用してテーブルをパーティション分割することはできません。
  • バリアント列をテーブルのクラスタリング キーにすることはできません。
  • GROUP BY句またはORDER BY句でバリアント列を使用することはできません。
  • バリアント列に対して DISTINCT を呼び出すことはできません。
  • バリアント列で SQL セット演算子 (INTERSECTUNIONEXCEPT) を使用することはできません。
  • 列の生成を使用してバリアント列を作成することはできません。
  • デルタでは、バリアント列の minValuesmaxValues 統計は収集されません。
  • バリアント列には、128 MiB (Databricks Runtime 17.1 以降では 16 MiB) を超える値を含めることはできません。