この記事では、AI/BI ダッシュボードのデータセット エディターを使用してダッシュボード データセットを作成および管理する方法について説明します。
データセットの定義
既存のデータセットを定義またはアクセスするには、ダッシュボードの左上隅付近にある [データ] タブをクリックします。 各ダッシュボードに含めることができるデータセットの数については、「 ダッシュボードの制限」を参照してください。
注
ダッシュボード クエリは読み取り専用です。 データセットの定義では、 DESCRIBE、 EXPLAIN、 CREATE TABLE、 INSERT、 DELETE などのコマンドはサポートされていません。 追加の SQL でラップできるクエリのみが有効です。
データセットを定義するには:
ダッシュボードの左上隅にある [ データ ] タブをクリックします。
次のいずれかのオプションを選択します。
- SQL から作成する: このオプションを使用して、任意のデータ ソースに新しい SQL クエリを記述します。
-
データ ソースを追加します。 このオプションを使用して、データセットの基となる Unity カタログ テーブルまたはビューを選択します。 ほとんどのテーブルとビューでは、データセットは既定の
SELECT *クエリによって定義され、データセットを絞り込むために変更できます。 クエリを変更して、ダッシュボード データセット内の使用可能なフィールドを削除または変換します。 データ ソースとしてメトリック ビュー (パブリック プレビュー) を選択すると、メトリック ビューで定義されている結果テーブルとスキーマがデータセットに表示されます。 「メトリック ビューを使用する」と「メトリック ビューとしてエクスポートする」を参照してください。 -
ファイルをアップロードします。 このオプションを使用して、新しいアセットを Unity カタログにアップロードします。 [ファイルのアップロード] ダイアログを使用して、[ カタログ]、[ スキーマ]、[ テーブル名] を選択します。 このアップロードに関連付けられているコンピューティングを処理するように、特定の SQL ウェアハウスを設定できます。
新しいテーブルの作成または既存のテーブルの上書きを選択することもできます。 既存のテーブルを上書きするには、選択したスキーマに対する
MANAGE権限が必要です。
SQL からデータセットを作成する
使用可能な任意のデータ ソースからプルするデータセットを定義できます。 クエリで、クエリ自体で 完全修飾テーブル名 を使用するか、ドロップダウン セレクターからカタログとスキーマの組み合わせをクエリ内のテーブル名と共に選択して、データ ソースを識別します。 クエリの完全修飾テーブル名は、エディターのカタログおよびスキーマ セレクターをオーバーライドします。 テーブルまたは列名にスペースが含まれている場合は、SQL クエリのバックティックでそれらの識別子をラップします。
SQL を使用してデータセットの結果を制限する
ダッシュボード ビューアーは、視覚化に表示されていない場合でも、データセット内のすべてのデータにアクセスできます。 機密データがブラウザーに送信されないようにするには、データセットを定義する SQL クエリで列の制限を行います。 たとえば、テーブルのすべての列を選択するのではなく、視覚化に必要な特定のフィールドのみを含めます。
Databricks では、以下のことをお勧めします。
-
SELECT *は避けてください。 代わりに、必要な列のみを明示的に選択します。 -
WHERE句またはその他のクエリ ロジックを使用して、必要な行のみが含まれるようにします。 - クエリの作成時にパラメーターでデータセット アクセスを拡張する方法に注意してください。
- 結果テーブルのスキーマを確認して、目的のフィールドのみが使用可能であることを確認します。
メトリック ビューを使用する
メトリック ビューをデータ ソースとして選択するか、SQL クエリで参照することで、ダッシュボードでメトリック ビューを使用できます。
データ ソースとしてメトリック ビューを選択します 。メトリック ビューを直接選択すると、データセットには定義されたすべてのディメンションとメジャーが含まれます。 列を除外したりフィルターを適用したりするようにデータセット クエリを変更することはできません。 カスタム計算を追加して、視覚化用の追加のメジャーまたはディメンションを作成できます。 「 カスタム計算とは」を参照してください。
クエリでメトリック ビューを参照する: 他のビューと同様に、SQL クエリでメトリック ビューを参照できます。 データセットをフィルター処理または整形する場合は、このメソッドを使用します。 すべてのメトリックビューの測定値は、
MEASURE集計関数を使用してアクセスする必要があります。 集計関数measure参照してください。
ダッシュボードを作成するときに新しいメトリック ビューを作成するには、「 メトリック ビューとしてエクスポートする」を参照してください。
データセットの管理
データセットを定義したら、 を使用します。データセット名の右側にある kebab メニューを使用して、次のオプションにアクセスします。
名前の変更: データセットにわかりやすい名前を付けて、編集または確認したいクエリをすばやく特定できるようにします。
名前の提案: クエリに基づいて名前の候補が自動的に生成されます。 この名前は、生成後に編集できます。
複製: クエリのインプレース コピーを作成します。 複製後にクエリを編集できます。
削除: データセットを削除します。 このオプションは、データセットがキャンバスで使用されている場合には利用できません。
ダウンロード: データセットは、CSV、TSV、Excel の各型式のファイルとしてダウンロードできます。
注
キャンバスで現在使用されているデータセットは、青いアイコンが付いた太字のテキストで表示され、未使用のデータセットには灰色のアイコンと太字以外の名前が付いています。
結果テーブルの表示
データセットを作成すると、クエリが自動的に実行され、結果がエディターの下のペインにテーブルとして表示されます。 各列には、そのデータ型を示すアイコンが含まれています。
列の値を並べ替えるには、次の手順に従います。
- 各列にカーソルを合わせて、
並べ替えアイコンを表示します。 - アイコンをクリックして、値を昇順または降順で並べ替えます。
クエリ結果のスキーマの表示
定義されたデータセットのスキーマを表示するには、[結果テーブル] の右側の [スキーマ] をクリックします。 [スキーマ] タブには、定義されたデータセットのすべてのフィールドが一覧表示されます。 各フィールドには、列のデータ型を示すアイコンでラベルが付けられます。 基になるテーブルまたはビューにコメントが含まれている場合は、[スキーマ] タブにそれが表示されます。
データセットからビューを生成する
データセットから具体化されたビューとメトリック ビューを生成して、ワークスペース全体の一貫性を維持できます。
データセットを具体化されたビューとしてエクスポートする
任意のデータセットを具体化されたビューとしてエクスポートできます。 具体化されたビューは、クエリ結果をキャッシュし、指定されたスケジュールで更新します。これにより、同じデータに繰り返しアクセスするときにクエリの実行時間を短縮できます。 具体化されたビューを参照してください。
データセットを具体化されたビューとしてエクスポートするには:
- エクスポートするデータセットの右側にある
をクリックします。
- マテリアライズドビューにエクスポートを選択します。
- [ 具体化されたビューにエクスポート] パネルで、カタログとスキーマのドロップダウン セレクターを使用して、具体化されたビューを保存する場所を選択します。 これは、具体化されたビューにアクセスして使用できるユーザーに影響します。 「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
- (省略可能)具体化されたビューの名前を入力します。 既定では、データセット タイトルは有効な具体化されたビュー名に変換されます。
- (省略可能)更新スケジュールとその他の具体化されたビュー設定を構成します。
- Create をクリックしてください。
具体化されたビューは、指定された Unity カタログの場所に作成され、ワークスペース全体の他のダッシュボードやクエリで使用できます。
注
既定では、具体化されたビューは作成時にダッシュボードに追加されます。 ダッシュボードに追加されていない具体化されたビューを作成するには、[ 具体化されたビュー にエクスポート] パネルの下部付近にある [具体化 されたビュー をダッシュボードに追加] をオフにします。
メトリック ビューとしてエクスポートする
Important
この機能は パブリック プレビュー段階です。
メトリック ビューでは、複雑なビジネス ロジックが一元化された定義に抽象化されるため、組織は主要業績評価指標を 1 回定義し、さまざまなレポート サーフェイスで一貫して使用できます。 Unity カタログのメトリック ビューを参照してください。 データセットをメトリック ビューとしてエクスポートしたり、アシスタントを使用してメトリック ビューを作成したりできます。 既存のデータセットに対してメジャーとディメンションが定義されている場合は、生成されたメトリック ビュー定義に自動的に表示されます。
データセットをメトリック ビューとしてエクスポートする
データセットをメトリック ビューとしてエクスポートするには:
- Kebab メニューの
をクリックします。メトリック ビューとしてエクスポートするデータセットの右側にあります。
- [ メトリック ビューの作成 ] パネルで、カタログとスキーマのドロップダウン セレクターを使用して、メトリック ビューが格納されているスキーマとカタログを選択します。 これは、メトリック ビューにアクセスして使用できるユーザーに影響します。 「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
- (省略可能)メトリック ビューの名前を入力します。 既定では、データセット タイトルは名前付け要件に基づいて有効なメトリック ビュー名に変換されます。
- (省略可能) YAML 定義 セクションで生成されたコンテンツを調整して、メトリック ビューを編集します。
- [保存] をクリックします。
注
既定では、メトリック ビューは作成時にダッシュボードに追加されます。 ダッシュボードに追加されていないメトリック ビューを作成するには、[メトリック ビューの作成] パネルの下部にあるダッシュボードにメトリック ビューを追加するをオフにします。
Databricks Assistant を使用してメトリック ビューを作成する
Databricks Assistant を使用してデータセットからメトリック ビューを作成します。
- データセット エディター
アシスタント アイコンをクリックします。 次に、[ メトリック ビューにエクスポート] をクリックします。
- 作成するメトリック ビューの説明を入力します。
- アシスタントは、メトリック ビュー定義のサンプルを返し、その中で定義されているディメンションとメジャーについて簡単に説明します。
- [ メトリック ビュー エディターを開く ] をクリックして、メトリック ビューを編集して保存します。
メトリック ビューの作成の詳細については、「メトリック ビューの作成」を参照してください。
カスタム計算
カスタム計算を使用すると、データセットを作成する SQL を変更することなく、既存のデータセットに計算を適用できます。 カスタム計算の作成と使用の詳細については、「カスタム計算 とは」を参照してください。
複数ステートメント クエリの記述
複数の SQL ステートメントを使用してデータセットを構築したい場合があります。 複数のステートメントを実行するには、各ステートメントをセミコロン (;) で区切ります。 これらのコマンドを実行してデータセットを作成すると、エディターの最後のステートメントの結果が出力に表示されます。 このデータセットは、キャンバス上の関連する視覚化に使用されます。
ステートメントは、それが発行されるデータセットに対してローカルです。 たとえば、USE ステートメントを含むデータセットを作成してカタログまたはスキーマを設定する場合、その設定はそのデータセットにのみ適用されます。
例示
次の例は、複数ステートメント クエリの一般的な使用例を示しています。
カタログとスキーマを設定する
USE ステートメントを記述して、クエリ内のテーブルのカタログとスキーマを宣言できます。 次のクエリには、3 つのステートメントが含まれています。 1 番目でカタログ名を設定します。 2 番目ではスキーマを設定します。 カタログとスキーマが設定されているため、SELECT ステートメントでは、テーブル名のみを参照します。
USE CATALOGを参照してください。
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
ANSI モードを設定する
ANSI_MODE を TRUE または FALSE に設定してクエリを実行するよう設定できます。 Databricks SQL の場合、ANSI_MODE のシステム既定値は TRUE です。
ANSI_MODEを参照してください。
次のクエリは、無効なデータ型の入力によってエラーがスローされるのではなく ANSI_MODE が返されるように、FALSE が NULL に設定されています。
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
複雑なクエリをパラメーター化する
複数のステートメントを使用して、共通テーブル式またはその他の複雑なクエリのビュー名をパラメーター化できます。
次のクエリでは、2 つの一時ビューが作成されます。
SELECT ステートメントでは、IDENTIFIER 句を使用して入力文字列をテーブル名として解釈します。
IDENTIFIER の条項を参照してください。
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
変数を設定する
次のクエリでは、最初のステートメントで変数と値を宣言します。 2 番目のステートメントで、変数の値を変更します。 3 番目のステートメントで、変数の最終的な値が 5 であることが示されます。 一時変数の使用に関する詳細と完全な構文については、「SET 変数」を参照してください。
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);