次の方法で共有


クイック スタート: ワンクリックでデータを取り込む (プレビュー)

Important

Azure Synapse Analytics データ エクスプローラー (プレビュー) は、2025 年 10 月 7 日に廃止されます。 この日以降、Synapse Data Explorer で実行されているワークロードは削除され、関連付けられているアプリケーション データは失われます。 Microsoft Fabric の Eventhouse に移行 することを強くお勧めします。

Microsoft Cloud Migration Factory (CMF) プログラムは、お客様が Fabric に移行できるように設計されています。 このプログラムは、顧客に無料でハンズオン キーボード リソースを提供します。 これらのリソースは、定義済みの合意されたスコープで、6 ~ 8 週間割り当てられます。 顧客の指名は、Microsoft アカウント チームから受け入れられるか、CMF チームに ヘルプの要求 を送信することによって直接受け入れられます。

ワンクリック インジェストにより、データ インジェスト プロセスが簡単、高速、直感的になります。 ワンクリック インジェストを使用すると、データの取り込み、データベース テーブルの作成、構造のマッピングをすばやく開始できます。 1 回限りのインジェスト プロセスまたは継続的インジェスト プロセスとして、さまざまな種類のソースから異なるデータ形式のデータを選択します。

次の機能により、ワンクリック インジェストが非常に便利になります。

  • インジェスト ウィザードの指示に従った直感的なエクスペリエンス
  • 数分でデータを取り込む
  • さまざまな種類のソース (ローカル ファイル、BLOB、コンテナー) からデータを取り込む (最大 10,000 BLOB)
  • さまざまな形式でデータを取り込む
  • 新規または既存のテーブルにデータを取り込む
  • テーブルマッピングとスキーマが推奨され、変更が容易

ワンクリック インジェストは、初めてデータを取り込む場合や、データのスキーマに慣れていない場合に特に便利です。

[前提条件]

  • Azure サブスクリプション。 無料の Azure アカウントを作成します。

  • Synapse Studio または Azure portal を使用して Data Explorer プールを作成します

  • Data Explorer データベースを作成します。

    1. Synapse Studio の左側のペインで、 [データ] を選択します。

    2. + (新しいリソースの追加) >[Data Explorer プール] を選択し、次の情報を使用します。

      Setting 推奨値 Description
      プール名 contosodataexplorer 使用する Data Explorer プールの名前
      名前 TestDatabase データベース名はクラスター内で一意である必要があります。
      既定のリテンション期間 365 クエリにデータを使用できることが保証される期間 (日数) です。 期間は、データが取り込まれた時点から測定されます。
      既定のキャッシュ期間 31 頻繁にクエリされるデータが、長期ストレージではなく SSD ストレージまたは RAM で利用できるように保持される期間 (日数) です。
    3. [作成] を選択してデータベースを作成します。 通常、作成にかかる時間は 1 分未満です。

  • テーブルの作成

    1. Synapse Studio の左側のウィンドウで、 [開発] を選択します。
    2. [KQL スクリプト] で、[+] (新しいリソースの追加) >[KQL スクリプト] を選びます。 右側のウィンドウで、スクリプト名を指定できます。
    3. [接続先] メニューで、[contosodataexplorer] を選択します。
    4. [データベースの使用] メニューで、 [TestDatabase] を選択します。
    5. 次のコマンドを貼り付け、 [実行] を選択してテーブルを作成します。
    .create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
    

    ヒント

    テーブルが正常に作成されたことを確認します。 左側のペインで、 [データ] を選択し、contosodataexplorer の [その他] メニューを選択し、 [最新の情報に更新] を選択します。 [contosodataexplorer][テーブル] を展開し、StormEvents テーブルが一覧に表示されていることを確認します。

ワンクリック ウィザードにアクセスする

ワンクリック インジェスト ウィザードを使用すると、ワンクリック インジェスト プロセスを実行できます。

  • Azure Synapse からウィザードにアクセスするには:

    1. Synapse Studio の左側のペインで、 [データ] を選択します。

    2. [Data Explorer データベース] で、関連するデータベースを右クリックし、[Azure Data Explorer で開く] を選択します。

      特定のプールのコンテキストで Azure Data Explorer を開いているところを示す Azure Synapse Studio のスクリーンショット。

    3. 関連するプールを右クリックし、[ 新しいデータの取り込み] を選択します。

  • Azure portal からウィザードにアクセスするには:

    1. Azure portal で、関連する Synapse ワークスペースを検索して選択します。

    2. [データ エクスプローラー プール] で、関連するプールを選択します。

    3. [ データ エクスプローラー プールへようこそ ] ホーム画面で、[ 新しいデータの取り込み] を選択します。

      特定のプールのコンテキストで Azure Data Explorer を開いている状態を示す Azure portal のスクリーンショット。

  • Azure Data Explorer Web UI からウィザードにアクセスするには:

    1. 開始する前に、次の手順を使用して、クエリとデータ インジェストのエンドポイントを取得します。
      1. Synapse Studio の左側のペインで、 [管理]>[Data Explorer プール] を選びます。

      2. 詳細を表示するために使用するデータ エクスプローラー プールを選択します。

        [データ エクスプローラー プール] 画面のスクリーンショット。既存のプールの一覧が表示されています。

      3. クエリとデータ インジェストのエンドポイントを書き留めます。 Data Explorer プールへの接続を構成するときは、クエリ エンドポイントをクラスターとして使用します。 データ インジェスト用に SDK を構成する場合は、データ インジェスト エンドポイントを使用します。

        [データ エクスプローラー プールのプロパティ] ウィンドウのスクリーンショット。クエリとデータ インジェストの URI アドレスが表示されています。

    2. Azure Data Explorer Web UI で、 クエリ エンドポイントへの接続を追加します。
    3. 左側のメニューから [クエリ ] を選択し、 データベース または テーブルを右クリックして、[ 新しいデータの取り込み] を選択します。

ワンクリック インジェスト ウィザード

このセクションでは、データ ソースとして Event Hub を使用するウィザードについて説明します。 これらの手順を使用して、BLOB、ファイル、BLOB コンテナー、ADLS Gen2 コンテナーからデータを取り込むこともできます。

サンプル値を Synapse ワークスペースの実際の値に置き換えます。

  1. [ 宛先 ] タブで、取り込まれたデータのデータベースとテーブルを選択します。

    データベースとテーブルの選択を示す Azure Data Explorer のワンクリック インジェスト ウィザードのスクリーンショット。

  2. [ソース] タブで、次の 手順 を実行します。

    1. インジェストのソースの種類として [イベント ハブ] を選択します。

      ソースの種類の選択を示す Azure Data Explorer のワンクリック インジェスト ウィザードのスクリーンショット。

    2. 次の情報を使用して、Event Hub データ接続の詳細を入力します。

      Setting 値の例 Description
      データ接続名 ContosoDataConnection Event Hub データ接続の名前
      Subscription Contoso_Synapse イベント ハブが存在するサブスクリプション。
      Even Hub 名前空間 contosoeventhubnamespace イベント ハブの名前空間。
      コンシューマー グループ contosoconsumergroup Even Hub コンシューマー グループの名前。

      Azure Data Explorer のワンクリック インジェスト ウィザードのスクリーンショット。Event Hub 接続の詳細が表示されています。

    3. [次へ] を選択します。

スキーマ マッピング

サービスによってスキーマとインジェストのプロパティが自動的に生成されます。このプロパティは変更できます。 新しいテーブルまたは既存のテーブルに取り込むかどうかに応じて、既存のマッピング構造を使用するか、新しいマッピング構造を作成できます。

[ スキーマ ] タブで、次の操作を行います。

  1. 自動生成された圧縮の種類を確認します。
  2. データの形式を選択します。 異なる形式を使用すると、さらに変更を加えることができるようになります。
  3. [エディター] ウィンドウでマッピングを変更します。

ファイル形式

ワンクリック インジェストでは、インジェスト のために Data Explorer でサポートされているすべてのデータ形式のソース データからの取り込みをサポートしています。

エディター ウィンドウ

[スキーマ] タブの [エディター] ウィンドウでは、必要に応じてデータ テーブルの列を調整できます。

テーブルで行うことができる変更は、次のパラメーターによって異なります。

  • テーブルの種類が新規かまたは既存か
  • マッピングの種類が新規かまたは既存か
テーブルの種類 マッピングの種類 可能な変更
新しいテーブル 新しいマッピング データ型の変更、列の名前変更、新しい列、列の削除、列の更新、昇順での並べ替え、降順の並べ替え
既存のテーブル 新しいマッピング 新しい列 (データ型の変更、名前の変更、更新が可能)
列の更新、昇順での並べ替え、降順での並べ替え
既存のマッピング 昇順で並べ替え、降順で並べ替え

新しい列を追加したり、列を更新したりするときに、マッピング変換を変更できます。 詳細については、「マッピング変換」を参照してください。

マッピング変換

一部のデータ形式マッピング (Parquet、JSON、Avro) では、単純な取り込み時間変換がサポートされています。 マッピング変換を適用するには、[ エディター] ウィンドウで列を作成または更新します。

マッピング変換は、 データ型 が int または long である Source を使用して、文字列型または datetime 型の列に対して実行できます。 サポートされているマッピング変換は次のとおりです。

  • DateTimeFromUnixSeconds
  • Unixミリ秒から日付時間取得 (DateTimeFromUnixMilliseconds)
  • Unixマイクロ秒から日付時間を取得
  • DateTimeFromUnixNanoseconds

データ インジェスト

スキーマ マッピングと列の操作が完了すると、インジェスト ウィザードによってデータ インジェスト プロセスが開始されます。

  • コンテナー以外のソースからデータを取り込む場合、インジェストはすぐに有効になります。

  • データ ソースが コンテナーの場合:

    • データ エクスプローラーの バッチ処理ポリシー によって、データが集計されます。
    • インジェスト後、インジェスト レポートをダウンロードし、対処された各 BLOB のパフォーマンスを確認できます。

初期データ探索

インジェスト後、ウィザードには、データの初期探索に クイック コマンド を使用するオプションが表示されます。

次のステップ