次の方法で共有


レイクハウスチュートリアル: レイクハウスの作成、サンプル データの取り込み、レポートの作成

このチュートリアルでは、Lakehouse を構築し、サンプル データをデルタ テーブルに取り込み、必要に応じて変換を適用してから、レポートを作成します。 実行する手順のチェックリストを次に示します。

Microsoft Fabric をお持ちでない場合は、無料 試用版の容量にサインアップしてください。

前提条件

このチュートリアルに OneDrive が必要な理由

データ インジェスト プロセスはファイルアップロードの基になるストレージ メカニズムとして OneDrive に依存するため、このチュートリアルには OneDrive が必要です。 CSV ファイルを Fabric にアップロードすると、レイクハウスに取り込まれる前に、一時的に OneDrive アカウントに保存されます。 この統合により、Microsoft 365 エコシステム内での安全でシームレスなファイル転送が保証されます。

アップロードされたファイルに Fabric がアクセスできないため、OneDrive を構成していない場合、インジェスト手順は機能しません。 レイクハウスまたはサポートされている別の場所でデータを既に使用できる場合、OneDrive は必要ありません。

Note

Lakehouse に既にデータがある場合は、サンプル CSV ファイルの代わりにそのデータを使用できます。 データが既に Lakehouse に関連付けられているかどうかを確認するには、Lakehouse Explorer または SQL 分析エンドポイントを使用して、テーブル、ファイル、フォルダーを参照します。 確認方法の詳細については、「 Lakehouse の概要 」および 「SQL 分析エンドポイントを使用して lakehouse テーブルにクエリを実行する」を参照してください。

レイクハウスを作成する

このセクションでは、Fabric で lakehouse を作成します。

  1. Fabricで、ナビゲーション バーから [ワークスペース] 選択します。

  2. ワークスペースを開くには、上部にある検索ボックスにその名前を入力し、検索結果から選択します。

  3. ワークスペースから [ 新しいアイテム] を選択し、検索ボックスに 「Lakehouse 」と入力し、[ Lakehouse] を選択します。

  4. [新しいレイクハウス] ダイアログ ボックスの [名前] フィールドに「wwilakehouse」 と入力します。

    [New lakehouse]\(新しいレイクハウス\) ダイアログ ボックスのスクリーンショット。

  5. [作成] を 選択して、新しいレイクハウスを作成して開きます。

サンプル データを取り込む

このセクションでは、サンプル顧客データをレイクハウスに取り込みます。

Note

OneDrive が構成されていない場合は、Microsoft 365 無料試用版にサインアップします: 無料試用版 - Microsoft 365 を 1 か月間試します

  1. Fabric サンプル リポジトリから dimension_customer.csv ファイルをダウンロードします。

  2. [ホーム] タブの [Lakehouse のデータを取得する] に、Lakehouse にデータを読み込むオプションが表示されます。 [新しいデータフロー Gen2] を選択します。

    データをレイクハウスに読み込むために選択する [新しい Dataflow Gen2] オプションの位置を示すスクリーンショット。

  3. [データフローの作成] ウィンドウで、[名前] フィールドに「Customer Dimension Data」と入力し、[次へ] を選択します。

    データフロー名を入力する場所を示す [データフローの作成] ペインのスクリーンショット。

  4. [新しいデータフロー] 画面で、[テキスト/CSV ファイルからインポート] を選択します。

  5. [データ ソースに接続] 画面で、[ファイルのアップロード] ラジオ ボタンを選択します。 手順 1 でダウンロードした dimension_customer.csv ファイルをドラッグ アンド ドロップします。 ファイルがアップロードされたら、[次へ] を選択します。

    [ファイルのアップロード] を選択する場所と、以前にダウンロードしたファイルをドラッグする場所を示すスクリーンショット。

  6. [ファイル データのプレビュー] ページでデータをプレビューし、[作成] を選択して続行し、データフロー キャンバスに戻ります。

データを変換してレイクハウスにロードする

このセクションでは、ビジネス要件に基づいてデータを変換し、Lakehouse に読み込みます。

  1. [クエリ設定] ウィンドウで、[名前] フィールドを dimension_customer に更新します。

    Note

    Fabric では、既定でテーブル名の末尾にスペースと番号が追加されます。 テーブル名は小文字で、スペースを含めることはできません。 適切に名前を変更し、テーブル名からスペースを削除します。

    クエリー設定ウィンドウのスクリーンショット。名前を入力する箇所とデータ変換先を選択する箇所が示されています。

  2. このチュートリアルでは、顧客データを Lakehouse に関連付けました。 lakehouse からデータフローを作成すると、アップロードされたデータは既定の lakehouse に自動的にリンクされます。 データフローを個別に作成する場合は、必要に応じて、次の手順に従って、データフローを lakehouse に関連付けることができます。

    1. メニュー項目から [データ変換先の追加] を選択し、[レイクハウス] を選択します。 [ データ変換先に接続 ] 画面で、必要に応じてアカウントにサインインし、[ 次へ] を選択します。

    2. ワークスペース内の wwilakehouse に移動します。

    3. dimension_customer テーブルが存在しない場合は、[新しいテーブル] 設定を選択し、テーブル名「dimension_customer」を入力します。 テーブルが既に存在する場合は、[既存のテーブル] 設定を選択し、オブジェクト エクスプローラーのテーブル一覧から dimension_customer を選択します。 [次へ] を選択します。

      変換先テーブルを選択する方法を示すスクリーンショット。

    4. [保存先の設定の選択] ウィンドウで、[更新方法] として [置換] を選択します。 [設定の保存] を選択して、データフロー キャンバスに戻ります。

  3. データフロー キャンバスから、ビジネス要件に基づいてデータを簡単に変換できます。 わかりやすくするために、このチュートリアルでは何も変更しません。 続行するには、ツール バーで [保存して実行 ] を選択します。

    [発行] ボタンを含む [クエリ設定] ペインのスクリーンショット。

  4. ワークスペースに戻り、 Customer Dimension Data データ フローにカーソルを合わせ、[ ... ] メニューを選択し、[ 今すぐ更新] を選択します。 このオプションはデータフローを実行し、ソース ファイルから Lakehouse テーブルにデータを移動します。 進行中は、データフローの名前の横に回転する円が表示されます。

    [今すぐ更新] アイコンを見つける場所を示すスクリーンショット。

  5. データフローが更新されたら、トップメニューのあなたのlakehouseを選択してdimension_customer Deltaテーブルを表示します。

    レイクハウスが開かれているナビゲーション パネルのスクリーンショット。

  6. テーブルを選択してデータをプレビューします。 SQL ステートメントでデータに対してクエリを実行するために、レイクハウスの SQL 分析エンドポイントを使用することもできます。 画面の右上にある Lakehouse ドロップダウン メニューから、SQL analytics エンドポイント を選択します。

    [SQL 分析エンドポイント] を選択する場所を示すデルタ テーブルのスクリーンショット。

  7. dimension_customer テーブルを選択してそのデータをプレビューするか、[新しい SQL クエリ] を選択して SQL ステートメントを記述します。

    [新しい SQL クエリ] を選択する場所を示す SQL 分析エンドポイント画面のスクリーンショット。

  8. 次のサンプル クエリは、dimension_customer テーブルの BuyingGroup 列に基づいて行数を集計します。 SQL クエリ ファイルは将来参照するために自動的に保存され、必要に応じてこれらのファイルの名前を変更または削除できます。

    スクリプトを実行するには、スクリプト ファイルの上部にある [実行] アイコンを選択します。

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

セマンティック モデルにテーブルを追加する

このセクションでは、セマンティック モデルにテーブルを追加して、それらを使用してレポートを作成できるようにします。

  1. Lakehouse を開き、 SQL 分析エンドポイント ビューに切り替え、[ 新しいセマンティック モデル] を選択し、セマンティック モデルに名前を付け、ワークスペースを割り当てて、セマンティック モデルに追加するテーブルを選択します。 この場合は、dimension_customer テーブルを選択します。

    セマンティック モデルに追加するテーブルを選択できるスクリーンショット。

レポートを作成する

このセクションでは、取り込まれたデータからレポートを作成します。

  1. ワークスペースでセマンティック モデルを選択し、[ このデータを探索する] ドロップダウンを選択し、[ レポートの自動作成] を選択します。 次のチュートリアルでは、最初からレポートを作成します。

    セマンティック モデルの詳細ページのスクリーンショット。[レポートの作成] を選択する場所が示されています。

  2. テーブルは次元であり、測度はありません。 Power BI では、行数のメジャーが作成され、さまざまな列に集計され、次の図に示すように異なるグラフが作成されます。

    4 つの異なる横棒グラフを表示している [クイック サマリ] ページのスクリーンショット。

  3. このレポートは、上部のリボンから [保存] を選択することで、今後のために保存できます。 他のテーブルまたは列を含めたり除外したりすることで、要件を満たすためにこのレポートにさらに変更を加えることができます。

次のステップ