Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Azure Synapse Analytics Data Explorer (Vorschau) wird am 7. Oktober 2025 eingestellt. Nach diesem Datum werden Arbeitslasten, die im Synapse-Daten-Explorer ausgeführt werden, gelöscht, und die zugehörigen Anwendungsdaten gehen verloren. Es wird dringend empfohlen , zu Eventhouse in Microsoft Fabric zu migrieren.
Das Microsoft Cloud Migration Factory (CMF)-Programm wurde entwickelt, um Kunden bei der Migration zu Fabric zu unterstützen. Das Programm bietet dem Kunden kostenlos praktische Tastaturressourcen. Diese Ressourcen werden für einen Zeitraum von 6-8 Wochen mit einem vordefinierten und vereinbarten Umfang zugewiesen. Kunden nominierungen werden vom Microsoft-Kontoteam oder direkt durch Senden einer Anfrage zur Hilfe an das CMF-Team akzeptiert.
Die Datenaufnahme ist der Prozess, mit dem Daten einer Tabelle hinzugefügt und für die Abfrage im Daten-Explorer zur Verfügung gestellt werden. Mit Ausnahme der Erfassung aus einer Abfrage müssen die Daten bei allen Erfassungsmethoden in einem der unterstützten Formate vorliegen. In der folgenden Tabelle sind die Formate aufgeführt und beschrieben, die der Daten-Explorer für die Datenaufnahme unterstützt.
Hinweis
Stellen Sie vor der Erfassung von Daten sicher, dass Ihre Daten ordnungsgemäß formatiert sind, und definieren Sie die erwarteten Felder. Es wird empfohlen, Ihr bevorzugtes Validierungssteuerelement zu verwenden, um zu überprüfen, ob das Format gültig ist. Die folgenden Validierungssteuerelemente können beispielsweise nützlich sein, um CSV- oder JSON-Dateien zu überprüfen:
- CSV: http://csvlint.io/
- JSON: https://jsonlint.com/
Weitere Informationen dazu, warum die Erfassung fehlschlägt, finden Sie unter "Erfassungsfehler" und "Erfassungsfehlercodes" im Daten-Explorer.
| Format | Extension | Description |
|---|---|---|
| ApacheAvro | .avro |
Ein AVRO-Format mit Unterstützung von logischen Typen. Folgende Komprimierungscodecs werden unterstützt: null, deflate und snappy. Die Readerimplementierung des Formats apacheavro basiert auf der apacheavro. |
| Avro | .avro |
Eine Legacyimplementierung des AVRO-Formats, die auf der .NET-Bibliothek basiert. Folgende Komprimierungscodecs werden unterstützt: null und deflate. (Verwenden Sie für snappy das Dateiformat ApacheAvro.) |
| CSV-Datei | .csv |
Eine Textdatei mit kommagetrennten Werten (,). Weitere Informationen finden Sie unter RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files (RFC 4180: Allgemeines Format und MIME-Typ für CSV-Dateien). |
| JSON | .json |
Eine Textdatei mit JSON-Objekten getrennt durch \n oder \r\n. Weitere Informationen finden Sie unter JSON Lines (JSONL). |
| MultiJSON | .multijson |
Eine Textdatei mit einem JSON-Array von Eigenschaftensammlungen, von denen jede einen Datensatz darstellt, oder eine beliebige Anzahl von Eigenschaftensammlungen, die durch Leerzeichen, \n oder \r\n getrennt sind. Jeder Eigenschaftenbehälter kann auf mehrere Zeilen verteilt sein. Dieses Format wird gegenüber JSON bevorzugt, es sei denn, die Daten sind keine Property Bags. |
| ORC | .orc |
Eine ORC-Datei. |
| Parquet | .parquet |
Eine Parquet-Datei |
| PSV | .psv |
Eine Textdatei mit durch senkrechte Striche getrennten Werten (|). |
| RAW | .raw |
Eine Textdatei, deren gesamter Inhalt ein einzelner Zeichenfolgenwert ist. |
| SCsv | .scsv |
Eine Textdatei mit durch Semikolons getrennten Werten (;). |
| SOHsv | .sohsv |
Eine Textdatei mit SOH-getrennten Werten. (SOH ist der ASCII-Codepunkt 1. Dieses Format wird von Hive in HDInsight verwendet.) |
| TSV | .tsv |
Eine Textdatei mit durch Tabstopps getrennten Werten (\t). |
| TSVE | .tsv |
Eine Textdatei mit durch Tabstopps getrennten Werten (\t). Als Escapezeichen wird ein umgekehrter Schrägstrich (\) verwendet. |
| TXT | .txt |
Eine Textdatei mit durch \n getrennten Zeilen. Leere Zeilen werden übersprungen. |
| W3CLOGFILE | .log |
Vom W3C standardisiertes Format der Webprotokolldatei |
Unterstützte Datenkomprimierungsformate
Blobs und Dateien können mit einem der folgenden Komprimierungsalgorithmen komprimiert werden:
| Komprimierung | Extension |
|---|---|
| GZip | .gz |
| Zip | .zip |
Geben Sie die Komprimierung an, indem Sie die Erweiterung dem Namen des Blobs oder der Datei anhängen.
Beispiel:
-
MyData.csv.zipgibt einen BLOB oder eine als CSV formatierte Datei an, komprimiert mit ZIP (Archiv oder eine einzelne Datei) -
MyData.json.gzgibt einen Blob oder eine als JSON formatierte Datei an, komprimiert mit GZip.
Blob- oder Dateinamen, die nicht die Formaterweiterungen, sondern nur die Komprimierung (z. B. MyData.zip) enthalten, werden ebenfalls unterstützt. In diesem Fall muss das Dateiformat als Aufnahmeeigenschaft angegeben werden, da es nicht abgeleitet werden kann.
Hinweis
- Bei einigen Komprimierungsformaten wird die ursprüngliche Dateierweiterung in den komprimierten Datenstrom aufgenommen. Diese Erweiterung wird bei der Bestimmung des Dateiformats generell ignoriert. Kann das Dateiformat nicht anhand des Namens des (komprimierten) Blobs oder der (komprimierten) Datei bestimmt werden, muss es mithilfe der Erfassungseigenschaft
formatangegeben werden. - Nicht zu verwechseln mit internen Komprimierungs-Codecs (Chunk-Ebene), die von
Parquet,AVROundORCFormaten verwendet werden. Der Name der internen Komprimierung wird einem Dateinamen in der Regel vor der Dateiformaterweiterung hinzugefügt. Beispiele:file1.gz.parquet,file1.snappy.avro, usw.
Nächste Schritte
- Erfahren Sie mehr über die Datenerfassung.
- Weitere Informationen zu Datenaufnahmeeigenschaften