Important
Azure Synapse Analytics データ エクスプローラー (プレビュー) は、2025 年 10 月 7 日に廃止されます。 この日以降、Synapse Data Explorer で実行されているワークロードは削除され、関連付けられているアプリケーション データは失われます。 Microsoft Fabric の Eventhouse に移行 することを強くお勧めします。
Microsoft Cloud Migration Factory (CMF) プログラムは、お客様が Fabric に移行できるように設計されています。 このプログラムは、顧客に無料でハンズオン キーボード リソースを提供します。 これらのリソースは、定義済みの合意されたスコープで、6 ~ 8 週間割り当てられます。 顧客の指名は、Microsoft アカウント チームから受け入れられるか、CMF チームに ヘルプの要求 を送信することによって直接受け入れられます。
ワンクリック インジェストにより、データ インジェスト プロセスが簡単、高速、直感的になります。 ワンクリック インジェストを使用すると、データの取り込み、データベース テーブルの作成、構造のマッピングをすばやく開始できます。 1 回限りのインジェスト プロセスまたは継続的インジェスト プロセスとして、さまざまな種類のソースから異なるデータ形式のデータを選択します。
次の機能により、ワンクリック インジェストが非常に便利になります。
- インジェスト ウィザードの指示に従った直感的なエクスペリエンス
- 数分でデータを取り込む
- さまざまな種類のソース (ローカル ファイル、BLOB、コンテナー) からデータを取り込む (最大 10,000 BLOB)
- さまざまな形式でデータを取り込む
- 新規または既存のテーブルにデータを取り込む
- テーブルマッピングとスキーマが推奨され、変更が容易
ワンクリック インジェストは、初めてデータを取り込む場合や、データのスキーマに慣れていない場合に特に便利です。
[前提条件]
Azure サブスクリプション。 無料の Azure アカウントを作成します。
Synapse Studio または Azure portal を使用して Data Explorer プールを作成します
Data Explorer データベースを作成します。
Synapse Studio の左側のペインで、 [データ] を選択します。
+ (新しいリソースの追加) >[Data Explorer プール] を選択し、次の情報を使用します。
Setting 推奨値 Description プール名 contosodataexplorer 使用する Data Explorer プールの名前 名前 TestDatabase データベース名はクラスター内で一意である必要があります。 既定のリテンション期間 365 クエリにデータを使用できることが保証される期間 (日数) です。 期間は、データが取り込まれた時点から測定されます。 既定のキャッシュ期間 31 頻繁にクエリされるデータが、長期ストレージではなく SSD ストレージまたは RAM で利用できるように保持される期間 (日数) です。 [作成] を選択してデータベースを作成します。 通常、作成にかかる時間は 1 分未満です。
テーブルの作成
- Synapse Studio の左側のウィンドウで、 [開発] を選択します。
- [KQL スクリプト] で、[+] (新しいリソースの追加) >[KQL スクリプト] を選びます。 右側のウィンドウで、スクリプト名を指定できます。
- [接続先] メニューで、[contosodataexplorer] を選択します。
- [データベースの使用] メニューで、 [TestDatabase] を選択します。
- 次のコマンドを貼り付け、 [実行] を選択してテーブルを作成します。
.create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)ヒント
テーブルが正常に作成されたことを確認します。 左側のペインで、 [データ] を選択し、contosodataexplorer の [その他] メニューを選択し、 [最新の情報に更新] を選択します。 [contosodataexplorer] で [テーブル] を展開し、StormEvents テーブルが一覧に表示されていることを確認します。
ワンクリック ウィザードにアクセスする
ワンクリック インジェスト ウィザードを使用すると、ワンクリック インジェスト プロセスを実行できます。
Azure Synapse からウィザードにアクセスするには:
Synapse Studio の左側のペインで、 [データ] を選択します。
[Data Explorer データベース] で、関連するデータベースを右クリックし、[Azure Data Explorer で開く] を選択します。
関連するプールを右クリックし、[ 新しいデータの取り込み] を選択します。
Azure portal からウィザードにアクセスするには:
Azure portal で、関連する Synapse ワークスペースを検索して選択します。
[データ エクスプローラー プール] で、関連するプールを選択します。
[ データ エクスプローラー プールへようこそ ] ホーム画面で、[ 新しいデータの取り込み] を選択します。
Azure Data Explorer Web UI からウィザードにアクセスするには:
- 開始する前に、次の手順を使用して、クエリとデータ インジェストのエンドポイントを取得します。
Synapse Studio の左側のペインで、 [管理]>[Data Explorer プール] を選びます。
詳細を表示するために使用するデータ エクスプローラー プールを選択します。
クエリとデータ インジェストのエンドポイントを書き留めます。 Data Explorer プールへの接続を構成するときは、クエリ エンドポイントをクラスターとして使用します。 データ インジェスト用に SDK を構成する場合は、データ インジェスト エンドポイントを使用します。
- Azure Data Explorer Web UI で、 クエリ エンドポイントへの接続を追加します。
- 左側のメニューから [クエリ ] を選択し、 データベース または テーブルを右クリックして、[ 新しいデータの取り込み] を選択します。
- 開始する前に、次の手順を使用して、クエリとデータ インジェストのエンドポイントを取得します。
ワンクリック インジェスト ウィザード
注
このセクションでは、データ ソースとして Event Hub を使用するウィザードについて説明します。 これらの手順を使用して、BLOB、ファイル、BLOB コンテナー、ADLS Gen2 コンテナーからデータを取り込むこともできます。
サンプル値を Synapse ワークスペースの実際の値に置き換えます。
[ 宛先 ] タブで、取り込まれたデータのデータベースとテーブルを選択します。
[ソース] タブで、次の 手順 を実行します。
インジェストのソースの種類として [イベント ハブ] を選択します。
次の情報を使用して、Event Hub データ接続の詳細を入力します。
Setting 値の例 Description データ接続名 ContosoDataConnection Event Hub データ接続の名前 Subscription Contoso_Synapse イベント ハブが存在するサブスクリプション。 Even Hub 名前空間 contosoeventhubnamespace イベント ハブの名前空間。 コンシューマー グループ contosoconsumergroup Even Hub コンシューマー グループの名前。
[次へ] を選択します。
スキーマ マッピング
サービスによってスキーマとインジェストのプロパティが自動的に生成されます。このプロパティは変更できます。 新しいテーブルまたは既存のテーブルに取り込むかどうかに応じて、既存のマッピング構造を使用するか、新しいマッピング構造を作成できます。
[ スキーマ ] タブで、次の操作を行います。
- 自動生成された圧縮の種類を確認します。
- データの形式を選択します。 異なる形式を使用すると、さらに変更を加えることができるようになります。
- [エディター] ウィンドウでマッピングを変更します。
ファイル形式
ワンクリック インジェストでは、インジェスト のために Data Explorer でサポートされているすべてのデータ形式のソース データからの取り込みをサポートしています。
エディター ウィンドウ
[スキーマ] タブの [エディター] ウィンドウでは、必要に応じてデータ テーブルの列を調整できます。
テーブルで行うことができる変更は、次のパラメーターによって異なります。
- テーブルの種類が新規かまたは既存か
- マッピングの種類が新規かまたは既存か
| テーブルの種類 | マッピングの種類 | 可能な変更 |
|---|---|---|
| 新しいテーブル | 新しいマッピング | データ型の変更、列の名前変更、新しい列、列の削除、列の更新、昇順での並べ替え、降順の並べ替え |
| 既存のテーブル | 新しいマッピング | 新しい列 (データ型の変更、名前の変更、更新が可能) 列の更新、昇順での並べ替え、降順での並べ替え |
| 既存のマッピング | 昇順で並べ替え、降順で並べ替え |
注
新しい列を追加したり、列を更新したりするときに、マッピング変換を変更できます。 詳細については、「マッピング変換」を参照してください。
マッピング変換
一部のデータ形式マッピング (Parquet、JSON、Avro) では、単純な取り込み時間変換がサポートされています。 マッピング変換を適用するには、[ エディター] ウィンドウで列を作成または更新します。
マッピング変換は、 データ型 が int または long である Source を使用して、文字列型または datetime 型の列に対して実行できます。 サポートされているマッピング変換は次のとおりです。
- DateTimeFromUnixSeconds
- Unixミリ秒から日付時間取得 (DateTimeFromUnixMilliseconds)
- Unixマイクロ秒から日付時間を取得
- DateTimeFromUnixNanoseconds
データ インジェスト
スキーマ マッピングと列の操作が完了すると、インジェスト ウィザードによってデータ インジェスト プロセスが開始されます。
コンテナー以外のソースからデータを取り込む場合、インジェストはすぐに有効になります。
データ ソースが コンテナーの場合:
- データ エクスプローラーの バッチ処理ポリシー によって、データが集計されます。
- インジェスト後、インジェスト レポートをダウンロードし、対処された各 BLOB のパフォーマンスを確認できます。
初期データ探索
インジェスト後、ウィザードには、データの初期探索に クイック コマンド を使用するオプションが表示されます。