Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
In deze quickstart leert u hoe gegevensstromen en pijplijnen samenwerken om een krachtige Data Factory-oplossing te maken. U schoont gegevens op met gegevensstromen en verplaatst deze met pijplijnen.
Voorwaarden
Voordat u begint, hebt u het volgende nodig:
- Een tenantaccount met een actief abonnement. Maak een gratis account.
- Een werkruimte waarvoor Microsoft Fabric is ingeschakeld: stel een werkruimte in die niet de standaard mijn werkruimte is.
- een Azure SQL-database met tabelgegevens.
- Blob Storage-account.
Gegevensstromen en pijplijnen vergelijken
Gegevensstroom Gen2 biedt een interface met weinig code met meer dan 300 gegevens en AI-transformaties. U kunt gegevens eenvoudig opschonen, voorbereiden en transformeren met flexibiliteit. Pijplijnen bieden uitgebreide mogelijkheden voor gegevensindeling voor het opstellen van flexibele gegevenswerkstromen die voldoen aan de behoeften van uw bedrijf.
In een pijplijn kunt u logische groeperingen maken van activiteiten die een taak uitvoeren. Dit kan bijvoorbeeld het aanroepen van een gegevensstroom zijn voor het opschonen en voorbereiden van uw gegevens. Hoewel er sprake is van een overlap tussen de twee functies, is uw keuze afhankelijk van of u de volledige mogelijkheden van pijplijnen nodig hebt of de eenvoudigere mogelijkheden van gegevensstromen kunt gebruiken. Zie de Fabric-besluitgids voor meer informatie.
Gegevens transformeren met gegevensstromen
Volg deze stappen om uw gegevensstroom in te stellen.
Een gegevensstroom maken
Selecteer uw Fabric-ingeschakelde werkruimte, vervolgens Nieuw en kies Dataflow Gen2.
Selecteer Importeren uit SQL Server in de gegevensstroomeditor.
Gegevens ophalen
Voer in het dialoogvenster Verbinding maken met gegevensbron de details van uw Azure SQL-database in en selecteer Volgende. Gebruik de AdventureWorksLT-voorbeelddatabase op basis van de vereisten.
Selecteer de gegevens die u wilt transformeren, zoals SalesLT.Customer, en gebruik Gerelateerde tabellen selecteren om gerelateerde tabellen op te nemen. Selecteer vervolgens Maken.
Uw gegevens transformeren
Selecteer de diagramweergave op de statusbalk of het menu Beeld in de Power Query-editor.
Selecteer met de rechtermuisknop uw SalesLT Customer-query of selecteer het verticale beletselteken rechts van de query en selecteer vervolgens Queries samenvoegen.
Configureer de samenvoeging met SalesLTOrderHeader als de rechtertabel, CustomerID als de joinkolom en Left outer als het jointype. Kies OK.
Voeg een gegevensbestemming toe door het databasesymbool met een pijl te selecteren. Kies Azure SQL-database als doeltype.
Geef de details op voor uw Azure SQL-databaseverbinding waar de samenvoegquery moet worden gepubliceerd. In dit voorbeeld gebruiken we ook de AdventureWorksLT-database die we als gegevensbron voor de bestemming hebben gebruikt.
Kies een database om de gegevens op te slaan en geef een tabelnaam op en selecteer vervolgens Volgende.
Accepteer de standaardinstellingen in het dialoogvenster Doelinstellingen kiezen en selecteer Instellingen opslaan.
Selecteer Publiceren in de gegevensstroomeditor om de gegevensstroom te publiceren.
Gegevens verplaatsen met pijplijnen
Nu u een Gegevensstroom Gen2 hebt gemaakt, kunt u ermee werken in een pijplijn. In dit voorbeeld kopieert u de gegevens die zijn gegenereerd op basis van de gegevensstroom in tekstindeling in een Azure Blob Storage-account.
Een nieuwe pipeline maken
Selecteer Nieuw in uw werkruimte en vervolgens Pijplijn.
Geef uw pijplijn een naam en selecteer Maken.
Uw gegevensstroom configureren
Voeg een gegevensstroomactiviteit toe aan uw pijplijn door Gegevensstroom te selecteren op het tabblad Activiteiten .
Selecteer de gegevensstroom op het pijplijncanvas, ga naar het tabblad Instellingen en kies de gegevensstroom die u eerder hebt gemaakt.
Selecteer Opslaan en voer vervolgens uit om de samengevoegde querytabel te vullen.
Een kopieeractiviteit toevoegen
Selecteer Gegevens kopiëren op het canvas of gebruik de Kopieerassistent op het tabblad Activiteiten .
Kies Azure SQL Database als gegevensbron en selecteer Volgende.
Maak een verbinding met uw gegevensbron door Nieuwe verbinding makente selecteren. Vul de vereiste verbindingsgegevens in het deelvenster in en voer AdventureWorksLT in voor de database, waar we de samenvoegquery in de gegevensstroom hebben gegenereerd. Selecteer vervolgens Volgende.
Selecteer de tabel die u eerder hebt gegenereerd in de gegevensstroomstap en selecteer vervolgens Volgende.
Kies voor uw bestemming Azure Blob Storage- en selecteer vervolgens Volgende.
Maak een verbinding met uw bestemming door Nieuwe verbinding makente selecteren. Geef de details voor uw verbinding op en selecteer vervolgens Volgende.
Selecteer uw mappad en geef een bestandsnaam open selecteer vervolgens Volgende.
Selecteer Volgende opnieuw om de standaardbestandsindeling, kolomscheidingsteken, rijscheidingsteken en compressietype te accepteren, eventueel inclusief een koptekst.
Voltooi uw instellingen. Controleer en selecteer vervolgens Opslaan en uitvoeren om het proces te voltooien.
Uw pijplijn ontwerpen en opslaan om gegevens uit te voeren en te laden
Als u de activiteit Kopiëren wilt uitvoeren na de activiteit Gegevensstroom, sleept u vanuit Geslaagd bij de activiteit Gegevensstroom naar de activiteit Kopiëren. De activiteit Kopiëren wordt alleen uitgevoerd nadat de activiteit Gegevensstroom is geslaagd.
Selecteer Opslaan om uw pijplijn op te slaan. Selecteer Vervolgens Uitvoeren om uw pijplijn uit te voeren en uw gegevens te laden.
Pijplijnuitvoering plannen
Zodra u klaar bent met het ontwikkelen en testen van uw pijplijn, kunt u plannen dat deze automatisch wordt uitgevoerd.
Selecteer op het tabblad Home van het venster pijplijneditor de optie Schema.
Configureer de planning naar behoefte. In het voorbeeld wordt de pijplijn dagelijks om 20:00 uur uitgevoerd tot het einde van het jaar.
Verwante inhoud
In dit voorbeeld ziet u hoe u een Gegevensstroom Gen2 maakt en configureert om een samenvoegquery te maken en op te slaan in een Azure SQL-database en vervolgens gegevens uit de database kopieert naar een tekstbestand in Azure Blob Storage. U hebt geleerd hoe u het volgende kunt doen:
- Maak een gegevensstroom.
- Gegevens transformeren met de gegevensstroom.
- Maak een pijplijn met behulp van de gegevensstroom.
- Orden de uitvoering van stappen in de pijplijn.
- Gegevens kopiëren met de Copy Assistant.
- Voer uw pijplijn uit en plan deze in.
Ga vervolgens verder om meer te leren over het monitoren van uw pijplijnruns.