データ ハブを探索する
データ ハブを使用すると、次の手順に示すように、ソース データおよびリンク サービスとやり取りして探索することができます。
Azure Synapse Studio の左側で、 データ ハブをクリックします。
データ ハブから、ワークスペース内のプロビジョニングされた SQL プール データベースと SQL サーバーレス データベースのほか、ストレージ アカウントやその他のリンク サービスなどの外部データ ソースにアクセスできます。
データ ハブ (1) の [ワークスペース (2)] タブで、[データベース] の下にある SQLPool01 (3) SQL プールを展開します。
テーブルとプログラミング/ストアド プロシージャを展開します。
SQL プールの下に一覧表示されている テーブル には、SAP Hana、X、Azure SQL Database、オーケストレーション パイプラインからコピーされた外部ファイルなど、複数のソースからのデータが格納されます。 Synapse Analytics では、これらのデータ ソースを組み合わせて分析とレポート作成を行うことができ、すべてを 1 か所で行うことができます。
ストアド プロシージャなどの使い慣れたデータベース コンポーネントも表示されます。 ストアド プロシージャは、T-SQL スクリプトを使用して実行したり、オーケストレーション パイプラインの一部として実行したりできます。
[ リンク] タブを選択し、 Azure Data Lake Storage Gen2 グループを展開してから、ワークスペースの プライマリ ストレージ を展開します。
すべての Synapse ワークスペースには、プライマリ ADLS Gen2 アカウントが関連付けられています。 これは データ レイクとして機能します。これは、オンプレミスのデータ ストアからコピーされたファイル、エクスポートされたデータ、外部サービスやアプリケーションから直接コピーされたデータ、テレメトリ データなど、フラット ファイルを格納するのに最適な場所です。すべてが 1 か所にあります。
この例では、ファイルとフォルダーを保持するコンテナーがいくつかあり、ワークスペース内から探索して使用することができます。 こちらには、たとえば、外部データベースからインポートされたマーケティング キャンペーン データ、CSV ファイル、財務情報のほか、機械学習アセット、IoT デバイス テレメトリ、SAP Hana データ、ツイートなどがあります。
すべてのデータが 1 か所に配置されているため、この場所で今すぐにプレビューを開始できます。
キャンペーン データを見てみましょう。
customcsv ストレージ コンテナーを選択します。
キャンペーン データをプレビューして、新しいキャンペーン名を調べましょう。
CampaignAnalyticsLatest.csv ファイル (1) を右クリックし、プレビュー (2) を選択します。
エクスプローラーの機能を使用すると、ファイルをすばやく検索して、それらに対してアクションを実行できます。ファイルの内容をプレビューしたり、新しい SQL スクリプトやノートブックを生成してファイルにアクセスしたり、新しいデータ フローまたはデータセットを作成したり、ファイルを管理したりすることができます。