Delen via


Azure Synapse Analytics-taak

van toepassing op:SQL Server SSIS Integration Runtime in Azure Data Factory

Met de Azure Synapse Analytics-taak kan een SSIS-pakket tabelgegevens kopiëren naar een toegewezen SQL-pool van Azure Synapse Analytics vanuit het bestandssysteem of Azure Blob Storage. De taak maakt gebruik van PolyBase om de prestaties te verbeteren, zoals beschreven in het artikel Azure Synapse Analytics Load Patterns and Strategies. De momenteel ondersteunde brongegevensbestandsindeling is tekst met scheidingstekens in UTF8-codering. Bij het kopiëren vanuit het bestandssysteem worden gegevens eerst geüpload naar Azure Blob Storage voor fasering en vervolgens naar een toegewezen SQL-pool. Daarom is een Azure Blob Storage-account nodig.

Opmerking

Azure Storage-verbindingsbeheer met het servicetype Data Lake Gen2 wordt niet ondersteund.

Als u Azure Data Lake Gen2 wilt gebruiken voor fasering of bron, kunt u verbinding maken via Azure Storage-verbindingsbeheer met het Azure Blob Storage-type.

De Azure Synapse Analytics-taak is een onderdeel van het SSIS-functiepakket (SQL Server Integration Services) voor Azure.

Als u een Azure Synapse Analytics-taak wilt toevoegen, sleept u deze vanuit de SSIS-werkset naar het ontwerpcanvas en dubbelklikt of klikt u met de rechtermuisknop en klikt u op Bewerken om het dialoogvenster taakeditor weer te geven.

Configureer de volgende eigenschappen op de pagina Algemeen .

Het SourceType geeft het type brongegevensarchief op. Selecteer een van de volgende typen:

  • Bestandssysteem: Brongegevens bevinden zich in het lokale bestandssysteem.
  • BlobStorage: Brongegevens bevinden zich in Azure Blob Storage.

Hieronder ziet u de eigenschappen voor elk brontype.

Bestandssysteem

Veld Description
Lokale Directory Hiermee geeft u de lokale map die de gegevensbestanden bevat die moeten worden geüpload.
Recursief Hiermee geeft u op of submappen recursief moeten worden doorzocht.
Bestandsnaam Hiermee geeft u een naamfilter om bestanden met een bepaald naampatroon te selecteren. Bijvoorbeeld MySheet*.xsl* bevat bestanden zoals MySheet001.xsl en MySheetABC.xslx.
RowDelimiter Hiermee geeft u de tekens aan waarmee het einde van elke rij wordt gemarkeerd.
Kolomscheidingsteken Hiermee geeft u een of meer tekens op die het einde van elke kolom markeren. Bijvoorbeeld | (pipe), \t (tab), ' (enkel aanhalingsteken), " (dubbel aanhalingsteken) en 0x5c (backslash).
IsFirstRowHeader Hiermee geeft u op of de eerste rij in elk gegevensbestand kolomnamen bevat in plaats van werkelijke gegevens.
AzureStorageConnection Hiermee geeft u een Azure Storage-verbindingsbeheer op.
BlobContainer Hiermee geeft u de naam op van de blobcontainer waarnaar lokale gegevens worden geüpload en doorgestuurd naar een toegewezen SQL-pool van Azure Synapse Analytics via PolyBase. Er wordt een nieuwe container gemaakt als deze niet bestaat.
BlobDirectory Hiermee geeft u de blobmap (virtuele hiërarchische structuur) op waarnaar lokale gegevens worden geüpload en doorgestuurd naar een toegewezen SQL-pool van Azure Synapse Analytics via PolyBase.
RetainFiles Hiermee geeft u op of de bestanden moeten worden bewaard die zijn geüpload naar Azure Storage.
Compressietype Hiermee geeft u de compressie-indeling op die moet worden gebruikt bij het uploaden van bestanden naar Azure Storage. Lokale bron wordt niet beïnvloed.
CompressionLevel Hiermee specificeert u het compressieniveau voor het compressieformaat.
SqlPoolConnection Hiermee geeft u een ADO.NET verbindingsbeheer voor toegewezen SQL-pool van Azure Synapse Analytics op.
TableName Hiermee geeft u de naam van de doeltabel. Kies een bestaande tabelnaam of maak een nieuwe tabel door Nieuwe tabel ...<te kiezen>.
TableDistribution Hiermee geeft u de distributiemethode voor nieuwe tabel. Is van toepassing als er een nieuwe tabelnaam is opgegeven voor TableName.
HashColumnName Specificeert de kolom die wordt gebruikt voor hashtabeldistributie. Is van toepassing als HASH is opgegeven voor TableDistribution.

BlobStorage

Veld Description
AzureStorageConnection Hiermee geeft u een Azure Storage-verbindingsbeheer op.
BlobContainer Hiermee geeft u de naam van de blobcontainer waarin brongegevens zich bevinden.
BlobDirectory Hiermee specificeert u de blob-directory (virtuele hiërarchische structuur) waarin de brongegevens zijn opgeslagen.
RowDelimiter Hiermee geeft u de tekens aan waarmee het einde van elke rij wordt gemarkeerd.
Kolomscheidingsteken Hiermee geeft u een of meer tekens op die het einde van elke kolom markeren. Bijvoorbeeld | (pipe), \t (tab), ' (enkele aanhalingsteken), " (dubbele aanhalingsteken) en 0x5c (backslash).
Compressietype Hiermee geeft u de compressie-indeling op die wordt gebruikt voor brongegevens.
SqlPoolConnection Hiermee geeft u een ADO.NET verbindingsbeheer voor toegewezen SQL-pool van Azure Synapse Analytics op.
TableName Stelt de naam van de doeltabel in. Kies een bestaande tabelnaam of maak een nieuwe tabel door Nieuwe tabel ...<te kiezen>.
TableDistribution Hiermee geeft u de distributiemethode voor nieuwe tabel. Is van toepassing als er een nieuwe tabelnaam is opgegeven voor TableName.
HashColumnName Hiermee specifieert u de kolom die wordt gebruikt voor de verdeling van de hashtabel. Is van toepassing als HASH is opgegeven voor TableDistribution.

U ziet een andere Toewijzingen pagina, afhankelijk van of u naar een nieuwe of een bestaande tabel kopieert. In het eerste geval configureert u welke bronkolommen moeten worden toegewezen en de bijbehorende namen in de te maken doeltabel. In het laatste geval configureert u de toewijzingsrelaties tussen bron- en doelkolommen.

Configureer op de pagina Kolommen de eigenschappen van het gegevenstype voor elke bronkolom.

Op de T-SQL-pagina ziet u de T-SQL die wordt gebruikt voor het laden van gegevens uit Azure Blob Storage naar een toegewezen SQL-pool. De T-SQL wordt automatisch gegenereerd op basis van configuraties op de andere pagina's en wordt uitgevoerd als onderdeel van de taakuitvoering. U kunt ervoor kiezen om de gegenereerde T-SQL handmatig te bewerken om aan uw specifieke behoeften te voldoen door op de knop Bewerken te klikken. U kunt later terugkeren naar de automatisch gegenereerde versie door op de knop Opnieuw instellen te klikken.