次の方法で共有


インジェストのために Azure Synapse Data Explorer でサポートされるデータ形式 (プレビュー)

Important

Azure Synapse Analytics データ エクスプローラー (プレビュー) は、2025 年 10 月 7 日に廃止されます。 この日以降、Synapse Data Explorer で実行されているワークロードは削除され、関連付けられているアプリケーション データは失われます。 Microsoft Fabric の Eventhouse に移行 することを強くお勧めします。

Microsoft Cloud Migration Factory (CMF) プログラムは、お客様が Fabric に移行できるように設計されています。 このプログラムは、顧客に無料でハンズオン キーボード リソースを提供します。 これらのリソースは、定義済みの合意されたスコープで、6 ~ 8 週間割り当てられます。 顧客の指名は、Microsoft アカウント チームから受け入れられるか、CMF チームに ヘルプの要求 を送信することによって直接受け入れられます。

データ インジェストは、テーブルにデータを追加し、データ エクスプローラーでクエリに使用できるようにするプロセスです。 ingest-from-query 以外のすべてのインジェスト方法では、データは、サポートされているいずれかの形式になっている必要があります。 次の表は、データ インジェストで Data Explorer でサポートされる形式の一覧と説明です。

データを取り込む前に、データが適切に書式設定され、必要なフィールドが定義されていることを確認してください。 形式が有効なであることを確かめるために、好みの検証ツールを使用することをお勧めします。 たとえば、CSV または JSON のファイルの検査には、次の検証ツールが役立ちます。

インジェストが失敗する理由の詳細については、データ エクスプローラーの インジェストエラーインジェストエラーコードを参照してください

Format Extension Description
ApacheAvro .avro 論理型をサポートする AVRO 形式。 次の圧縮コーデックがサポートされています: nulldeflatesnappyapacheavro 形式のリーダー実装は、公式の apacheavroに基づいています。
Avro .avro .NET ライブラリに基づいた AVRO 形式のレガシ実装。 次の圧縮コーデックがサポートされています: nulldeflate、(snappy については、ApacheAvro データ形式を使用します)。
CSV .csv コンマ区切り値 (,) を含むテキスト ファイル。 RFC 4180: コンマ区切り値 (CSV) ファイルの共通形式と MIME の種類に関するページを参照してください。
JSON .json \n または \r\n で区切られた JSON オブジェクトを含むテキスト ファイル。 「JSON Lines (JSONL)」を参照してください。
MultiJSON .multijson プロパティ バッグの JSON 配列 (各レコードを表す) を含むテキスト ファイル、または空白、 \n 、または \r\nで区切られた任意の数のプロパティ バッグ。 各プロパティ バッグは、複数の行にまたがることができます データがプロパティバッグではない場合を除いて、この形式はJSONよりも優先されます。
ORC .orc ORC ファイル
Parquet .parquet Parquet ファイル
PSV .psv パイプ区切り値を含むテキスト ファイル (|)。
RAW .raw コンテンツ全体が 1 つの文字列値であるテキスト ファイル。
SCsv .scsv セミコロン区切り値 (;) を含むテキスト ファイル。
SOHsv .sohsv SOH で区切られた値を含むテキスト ファイル。 (SOH は ASCII コードポイント 1 です。この形式は、HDInsight の Hive によって使用されます)。
TSV .tsv タブ区切り値 (\t) を含むテキスト ファイル。
TSVE .tsv タブ区切り値 (\t) を含むテキスト ファイル。 エスケープにはバックスラッシュ文字 (\) が使用されます。
TXT .txt \n で区切られた行を含むテキスト ファイル。 空の行はスキップされます。
W3CLOGFILE .log W3C によって規格化された Web ログ ファイルのフォーマットです。

サポートされているデータ圧縮形式

次のいずれかの圧縮アルゴリズムを使用して BLOB とファイルを圧縮できます。

Compression Extension
GZip .gz
ZIPファイル .zip

BLOB またはファイルの名前に拡張子を追加して、圧縮を示します。

例えば次が挙げられます。

  • MyData.csv.zip は、ZIP (アーカイブまたは 1 つのファイル) で圧縮された、CSV 形式の BLOB またはファイルを示します。
  • MyData.json.gz は、GZip で圧縮された JSON 形式の BLOB またはファイルを示します。

形式拡張子がなく圧縮のみが含まれている BLOB またはファイルの名前 (例: MyData.zip) もサポートされています。 この場合、ファイル形式は推論できないため、インジェスト プロパティとして指定する必要があります。

  • 一部の圧縮形式では、元のファイル拡張子が圧縮ストリームの一部として追跡されます。 この拡張子は通常、ファイル形式の判別では無視されます。 (圧縮された) BLOB またはファイルの名前からファイル形式を判別できない場合は、format インジェスト プロパティを使用して指定する必要があります。
  • ParquetAVRO、およびORC形式で使用される内部 (チャンク レベル) 圧縮コーデックと混同しないでください。 内部圧縮名は、通常、ファイル形式拡張子の前のファイル名に追加されます (例: file1.gz.parquetfile1.snappy.avro など)。

次のステップ