Important
Azure Synapse Analytics データ エクスプローラー (プレビュー) は、2025 年 10 月 7 日に廃止されます。 この日以降、Synapse Data Explorer で実行されているワークロードは削除され、関連付けられているアプリケーション データは失われます。 Microsoft Fabric の Eventhouse に移行 することを強くお勧めします。
Microsoft Cloud Migration Factory (CMF) プログラムは、お客様が Fabric に移行できるように設計されています。 このプログラムは、顧客に無料でハンズオン キーボード リソースを提供します。 これらのリソースは、定義済みの合意されたスコープで、6 ~ 8 週間割り当てられます。 顧客の指名は、Microsoft アカウント チームから受け入れられるか、CMF チームに ヘルプの要求 を送信することによって直接受け入れられます。
データ インジェストは、テーブルにデータを追加し、データ エクスプローラーでクエリに使用できるようにするプロセスです。 ingest-from-query 以外のすべてのインジェスト方法では、データは、サポートされているいずれかの形式になっている必要があります。 次の表は、データ インジェストで Data Explorer でサポートされる形式の一覧と説明です。
注
データを取り込む前に、データが適切に書式設定され、必要なフィールドが定義されていることを確認してください。 形式が有効なであることを確かめるために、好みの検証ツールを使用することをお勧めします。 たとえば、CSV または JSON のファイルの検査には、次の検証ツールが役立ちます。
- CSV: http://csvlint.io/
- JSON: https://jsonlint.com/
インジェストが失敗する理由の詳細については、データ エクスプローラーの インジェストエラー と インジェストエラーコードを参照してください。
| Format | Extension | Description |
|---|---|---|
| ApacheAvro | .avro |
論理型をサポートする AVRO 形式。 次の圧縮コーデックがサポートされています: null、deflate、snappy。
apacheavro 形式のリーダー実装は、公式の apacheavroに基づいています。 |
| Avro | .avro |
.NET ライブラリに基づいた AVRO 形式のレガシ実装。 次の圧縮コーデックがサポートされています: null、deflate、(snappy については、ApacheAvro データ形式を使用します)。 |
| CSV | .csv |
コンマ区切り値 (,) を含むテキスト ファイル。
RFC 4180: コンマ区切り値 (CSV) ファイルの共通形式と MIME の種類に関するページを参照してください。 |
| JSON | .json |
\n または \r\n で区切られた JSON オブジェクトを含むテキスト ファイル。 「JSON Lines (JSONL)」を参照してください。 |
| MultiJSON | .multijson |
プロパティ バッグの JSON 配列 (各レコードを表す) を含むテキスト ファイル、または空白、 \n 、または \r\nで区切られた任意の数のプロパティ バッグ。 各プロパティ バッグは、複数の行にまたがることができます データがプロパティバッグではない場合を除いて、この形式はJSONよりも優先されます。 |
| ORC | .orc |
ORC ファイル。 |
| Parquet | .parquet |
Parquet ファイル。 |
| PSV | .psv |
パイプ区切り値を含むテキスト ファイル (|)。 |
| RAW | .raw |
コンテンツ全体が 1 つの文字列値であるテキスト ファイル。 |
| SCsv | .scsv |
セミコロン区切り値 (;) を含むテキスト ファイル。 |
| SOHsv | .sohsv |
SOH で区切られた値を含むテキスト ファイル。 (SOH は ASCII コードポイント 1 です。この形式は、HDInsight の Hive によって使用されます)。 |
| TSV | .tsv |
タブ区切り値 (\t) を含むテキスト ファイル。 |
| TSVE | .tsv |
タブ区切り値 (\t) を含むテキスト ファイル。 エスケープにはバックスラッシュ文字 (\) が使用されます。 |
| TXT | .txt |
\n で区切られた行を含むテキスト ファイル。 空の行はスキップされます。 |
| W3CLOGFILE | .log |
W3C によって規格化された Web ログ ファイルのフォーマットです。 |
サポートされているデータ圧縮形式
次のいずれかの圧縮アルゴリズムを使用して BLOB とファイルを圧縮できます。
| Compression | Extension |
|---|---|
| GZip | .gz |
| ZIPファイル | .zip |
BLOB またはファイルの名前に拡張子を追加して、圧縮を示します。
例えば次が挙げられます。
-
MyData.csv.zipは、ZIP (アーカイブまたは 1 つのファイル) で圧縮された、CSV 形式の BLOB またはファイルを示します。 -
MyData.json.gzは、GZip で圧縮された JSON 形式の BLOB またはファイルを示します。
形式拡張子がなく圧縮のみが含まれている BLOB またはファイルの名前 (例: MyData.zip) もサポートされています。 この場合、ファイル形式は推論できないため、インジェスト プロパティとして指定する必要があります。
注
- 一部の圧縮形式では、元のファイル拡張子が圧縮ストリームの一部として追跡されます。 この拡張子は通常、ファイル形式の判別では無視されます。 (圧縮された) BLOB またはファイルの名前からファイル形式を判別できない場合は、
formatインジェスト プロパティを使用して指定する必要があります。 -
Parquet、AVRO、およびORC形式で使用される内部 (チャンク レベル) 圧縮コーデックと混同しないでください。 内部圧縮名は、通常、ファイル形式拡張子の前のファイル名に追加されます (例:file1.gz.parquet、file1.snappy.avroなど)。
次のステップ
- データ インジェストの詳細を確認する
- データ インジェストプロパティの詳細