Formaty danych obsługiwane przez usługę Azure Synapse Data Explorer do pozyskiwania (wersja zapoznawcza)

Ważne

Eksplorator danych usługi Azure Synapse Analytics (wersja zapoznawcza) zostanie wycofany 7 października 2025 r. Po tej dacie obciążenia uruchomione w usłudze Synapse Data Explorer zostaną usunięte, a skojarzone dane aplikacji zostaną utracone. Zdecydowanie zalecamy migrację do usługi Eventhouse w usłudze Microsoft Fabric.

Program Microsoft Cloud Migration Factory (CMF) ma na celu pomoc klientom w migracji do sieci szkieletowej. Program oferuje praktyczne zasoby klawiaturowe bez ponoszenia kosztów dla klienta. Te zasoby są przypisywane przez okres 6–8 tygodni ze wstępnie zdefiniowanym i uzgodnionym zakresem. Nominacje klientów są akceptowane przez zespół ds. kont Microsoft lub bezpośrednio, przesyłając wniosek o pomoc zespołowi CMF.

Pozyskiwanie danych to proces, za pomocą którego dane są dodawane do tabeli i udostępniane do wykonywania zapytań w Eksploratorze danych. W przypadku wszystkich metod pozyskiwania, innych niż pozyskiwanie z zapytania, dane muszą być w jednym z obsługiwanych formatów. W poniższej tabeli wymieniono i opisano formaty obsługiwane przez Eksplorator danych na potrzeby pozyskiwania danych.

Uwaga / Notatka

Przed pozyskiwaniem danych upewnij się, że dane są prawidłowo sformatowane i definiują oczekiwane pola. Zalecamy użycie preferowanego modułu sprawdzania poprawności w celu potwierdzenia, że format jest prawidłowy. Na przykład można znaleźć następujące moduły sprawdzania poprawności przydatne do sprawdzania plików CSV lub JSON:

CSV: http://csvlint.io/
JSON: https://jsonlint.com/

Aby uzyskać więcej informacji na temat przyczyn niepowodzenia pozyskiwania, zobacz Błędy pozyskiwania i Kody błędów pozyskiwania w Eksploratorze danych.

Format	Extension	Description
ApacheAvro	`.avro`	Format AVRO z obsługą typów logicznych. Obsługiwane są następujące kodery kompresji: `null`, `deflate`i `snappy`. Implementacja czytnika `apacheavro` formatu jest oparta na oficjalnej bibliotece Apache Avro.
Avro	`.avro`	Starsza implementacja formatu AVRO oparta na bibliotece .NET. Obsługiwane są następujące kodery kompresji: `null`, `deflate` (dla `snappy` — użyj `ApacheAvro` formatu danych).
CSV	`.csv`	Plik tekstowy z wartościami rozdzielanymi przecinkami (`,`). Zobacz RFC 4180: Wspólny format i typ MIME dla plików wartości rozdzielanych przecinkami (CSV).
JSON	`.json`	Plik tekstowy z obiektami JSON rozdzielanymi przez `\n` lub `\r\n`. Zobacz Wiersze JSON (JSONL).
MultiJSON	`.multijson`	Plik tekstowy z tablicą JSON worków właściwości (z których każdy reprezentuje rekord), lub dowolną liczbą worków właściwości oddzielonych spacjami `\n` lub `\r\n`. Każda torba właściwości może być rozłożona na wiele linii. Ten format jest preferowany w przypadku `JSON`, chyba że dane nie są workami atrybutów.
ORC	`.orc`	Plik ORC.
Parquet	`.parquet`	Plik Parquet.
PSV	`.psv`	Plik tekstowy z wartościami rozdzielanymi potokami (`\|`).
RAW	`.raw`	Plik tekstowy, którego cała zawartość jest pojedynczą wartością ciągu.
SCsv	`.scsv`	Plik tekstowy z wartościami rozdzielanymi średnikami (`;`).
SOHsv	`.sohsv`	Plik tekstowy z wartościami rozdzielanymi SOH. (SOH to kodowy punkt ASCII 1; ten format jest używany przez program Hive w usłudze HDInsight).
TSV	`.tsv`	Plik tekstowy z wartościami rozdzielanymi tabulatorami (`\t`).
TSVE	`.tsv`	Plik tekstowy z wartościami rozdzielanymi tabulatorami (`\t`). Znak ukośnika odwrotnego (`\`) jest używany do ucieczki.
plik TXT	`.txt`	Plik tekstowy z wierszami rozdzielanymi przez `\n`. Puste wiersze są pomijane.
W3CLOGFILE	`.log`	Format pliku dziennika sieci Web ustandaryzowany przez W3C.

Obsługiwane formaty kompresji danych

Obiekty blob i pliki można skompresować za pomocą dowolnego z następujących algorytmów kompresji:

Compression	Extension
GZip	.gz
ZIP	.zip

Wskaż kompresję, dołączając rozszerzenie do nazwy obiektu blob lub pliku.

Przykład:

MyData.csv.zip wskazuje na obiekt blob lub plik sformatowany jako CSV, skompresowany do formatu ZIP (archiwum lub pojedynczy plik)
MyData.json.gz wskazuje obiekt blob lub plik sformatowany jako JSON, skompresowany za pomocą biblioteki GZip.

Obsługiwane są również nazwy obiektów blob lub plików, które nie zawierają rozszerzeń formatu, MyData.zipale tylko kompresja (na przykład ). W takim przypadku format pliku musi być określony jako właściwość wczytywania, ponieważ nie można go wywnioskować.

Uwaga / Notatka

Niektóre formaty kompresji śledzą oryginalne rozszerzenie pliku w ramach skompresowanego strumienia. To rozszerzenie jest zwykle ignorowane do określania formatu pliku. Jeśli nie można określić formatu pliku z (skompresowanego) obiektu blob lub nazwy pliku, należy go określić za pomocą właściwości pozyskiwania format .
Nie należy mylić z wewnętrznym (na poziomie fragmentu) kodekiem kompresji używanym przez Parquet formaty AVRO i ORC. Nazwa kompresji wewnętrznej jest zwykle dodawana do nazwy pliku przed rozszerzeniem formatu pliku, na przykład: file1.gz.parquet, file1.snappy.avro, itp.

Dalsze kroki

Dowiedz się więcej o pozyskiwaniu danych
Dowiedz się więcej o właściwościach pozyskiwania danych

Last updated on 2025-03-24

Udostępnij przez

Formaty danych obsługiwane przez usługę Azure Synapse Data Explorer do pozyskiwania (wersja zapoznawcza)

Obsługiwane formaty kompresji danych

Dalsze kroki

Dodatkowe źródła