Delen via


Wat is Dataflow Gen2?

Gegevensstromen zijn een cloudhulpprogramma waarmee u gegevens kunt voorbereiden en transformeren zonder code te schrijven. Ze bieden een interface met weinig code voor het opnemen van gegevens uit honderden gegevensbronnen, het transformeren van uw gegevens met 300+ gegevenstransformaties en het laden van de resulterende gegevens naar meerdere bestemmingen. U kunt ze beschouwen als uw assistent voor persoonlijke gegevens die verbinding kunnen maken met honderden verschillende gegevensbronnen, rommelige gegevens kunnen opschonen en deze precies kunnen leveren waar u deze nodig hebt. Of u nu een burger of professionele ontwikkelaar bent, gegevensstromen bieden u een moderne ervaring voor gegevensintegratie voor het opnemen, voorbereiden en transformeren van gegevens uit een uitgebreide set gegevensbronnen, waaronder databases, datawarehouse, Lakehouse, realtime gegevens en meer.

Dataflow Gen2 is de nieuwere, krachtigere versie die naast de oorspronkelijke Power BI-gegevensstroom (nu Gen1 genoemd) werkt. Gebouwd met behulp van de vertrouwde Power Query-ervaring die beschikbaar is in verschillende Microsoft-producten en -services, zoals Excel, Power BI, Power Platform en Dynamics 365, biedt Dataflow Gen2 verbeterde functies, betere prestaties en snelle kopieermogelijkheden om snel gegevens op te nemen en te transformeren. Als u nieuw begint, raden we Dataflow Gen2 aan voor de verbeterde functies en betere prestaties.

Wat kunt u doen met gegevensstromen?

Met gegevensstromen kunt u het volgende doen:

  • Maak verbinding met uw gegevens: haal gegevens op uit databases, bestanden, webservices en meer.
  • Uw gegevens transformeren: uw gegevens opschonen, filteren, combineren en opnieuw vormgeven met behulp van een visuele interface.
  • Gegevens overal laden: uw getransformeerde gegevens verzenden naar databases, datawarehouses of cloudopslag.
  • Automatiseer het proces: stel planningen in zodat uw gegevens actueel en up-to-date blijven.

Gegevensstroomfuncties

Dit zijn de functies die beschikbaar zijn tussen Dataflow Gen2 en Gen1:

Kenmerk Gegevensstroom Gen2 Gegevensstroom Gen1
Gegevensstromen maken met Power Query
Eenvoudiger creatieproces
Automatisch opslaan en achtergrondpublicatie
Meerdere uitvoerbestemmingen
Betere monitoring en bijhouden van updates
Werkt met pijplijnen
Prestatiegerichte computing
Verbinding maken via de gegevensstroomconnector
Directe query via de gegevensstroomconnector
Alleen gewijzigde gegevens vernieuwen
Inzichten op basis van AI

Upgrades naar Dataflow Gen2

In de volgende secties zijn enkele van de belangrijkste verbeteringen in Dataflow Gen2 vergeleken met Gen1 om uw gegevensvoorbereidingstaken gemakkelijker en efficiënter te maken.

Gen2 is eenvoudiger te maken en te gebruiken

Gegevensstroom Gen2 voelt zich bekend als u Power Query eerder hebt gebruikt. We hebben het proces gestroomlijnd zodat u sneller aan de slag kunt. U wordt stapsgewijs begeleid bij het ophalen van gegevens in uw gegevensstroom en we hebben het aantal benodigde stappen voor het maken van uw gegevensstromen verminderd.

Schermopname van de algehele ontwerpervaring in gegevensstromen.

Automatisch opslaan zorgt ervoor dat uw werk veilig blijft

Gegevensstroom Gen2 slaat uw wijzigingen automatisch op terwijl u werkt. U kunt van uw computer afstappen, uw browser sluiten of de internetverbinding verliezen zonder dat u zich zorgen hoeft te maken over het verliezen van uw voortgang. Als je terugkomt, is alles precies waar je het achterliet.

Zodra u klaar bent met het bouwen van uw gegevensstroom, kunt u uw wijzigingen publiceren. Als u publiceert, worden uw werk opgeslagen en worden achtergrondvalidaties uitgevoerd, zodat u niet hoeft te wachten totdat u verdergaat met de volgende taak.

Om meer te weten te komen over hoe het opslaan werkt, bekijk een concept van uw gegevensstroom opslaan.

Gegevens verzenden waar u deze nodig hebt

Hoewel Gegevensstroom Gen1 getransformeerde gegevens opslaat in een eigen interne opslag (waartoe u toegang hebt via de gegevensstroomconnector), biedt Dataflow Gen2 u de flexibiliteit om die opslag te gebruiken of uw gegevens naar verschillende bestemmingen te verzenden.

Deze flexibiliteit biedt nieuwe mogelijkheden. U kunt bijvoorbeeld het volgende doen:

  • Een gegevensstroom gebruiken om gegevens in een lakehouse te laden en deze vervolgens te analyseren met een notebook
  • Gegevens laden in een Azure SQL-database en vervolgens een pijplijn gebruiken om deze naar een datawarehouse te verplaatsen

Gegevensstroom Gen2 ondersteunt momenteel deze bestemmingen:

  • Azure SQL-databases
  • Azure Data Explorer (Kusto)
  • Azure Datalake Gen2 (preview)
  • Fabric Lakehouse-tabellen
  • Fabric Lakehouse Files (voorvertoning)
  • Textielmagazijn
  • Fabric KQL-database
  • Fabric SQL-database
  • SharePoint-bestanden

Schermopname met de ondersteunde gegevensbestemmingen weergegeven.

Zie Gegevensstroom Gen2-gegevensbestemmingen en beheerde instellingen voor meer informatie over de beschikbare gegevensbestemmingen.

Betere monitoring en bijhouden van updates

Gegevensstroom Gen2 geeft u een duidelijker beeld van wat er gebeurt met het vernieuwen van uw gegevens. We hebben geïntegreerd met Monitoring Hub en de vernieuwingsgeschiedeniservaring verbeterd, zodat u de status en prestaties van uw gegevensstromen kunt bijhouden.

Schermopname met de details van een vernieuwingsstatus.

Werkt naadloos met pijplijnen

Met pijplijnen kunt u activiteiten groeperen om grotere taken uit te voeren. U kunt ze beschouwen als werkstromen die gegevens kunnen kopiëren, SQL-query's kunnen uitvoeren, opgeslagen procedures kunnen uitvoeren of Python-notebooks kunnen uitvoeren.

U kunt meerdere activiteiten in een pijplijn verbinden en instellen dat deze volgens een schema wordt uitgevoerd. U kunt bijvoorbeeld elke maandag een pijplijn gebruiken om gegevens op te halen uit een Azure-blob en op te schonen, en vervolgens een Dataflow Gen2 activeren om de logboekgegevens te analyseren. Of aan het einde van de maand kunt u gegevens kopiëren van een Azure-blob naar een Azure SQL-database en vervolgens een opgeslagen procedure uitvoeren op die database.

Schermopname van de integratie met pijplijnen.

Zie gegevensstroomactiviteiten voor meer informatie over het verbinden van gegevensstromen met pijplijnen.

Prestatiegerichte computing

Dataflow Gen2 maakt gebruik van geavanceerde COMPUTE Fabric SQL Compute-engines om grote hoeveelheden gegevens efficiënt te verwerken. Om dit werk te maken, maakt Dataflow Gen2 zowel Lakehouse- als Warehouse-items in uw werkruimte en gebruikt deze om gegevens op te slaan en te openen, waardoor de prestaties voor al uw gegevensstromen worden verbeterd.

Copilot voor Dataflow Gen2

Dataflow Gen2 kan worden geïntegreerd met Microsoft Copilot in Fabric om ai-hulp te bieden bij het maken van oplossingen voor gegevensintegratie met behulp van prompts in natuurlijke taal. Copilot helpt u het ontwikkelingsproces van uw gegevensstroom te stroomlijnen door u in staat te stellen gesprekstaal te gebruiken om gegevenstransformaties en -bewerkingen uit te voeren.

  • Gegevens ophalen uit bronnen: gebruik de startersprompt Gegevens ophalen om verbinding te maken met verschillende gegevensbronnen, zoals OData, databases en bestanden
  • Gegevens transformeren met natuurlijke taal: Transformaties toepassen met behulp van gespreksprompts zoals:
    • "Alleen Europese klanten behouden"
    • "Het totale aantal werknemers per plaats tellen"
    • "Alleen orders bewaren waarvan de hoeveelheden boven de mediaanwaarde liggen"
  • Voorbeeldgegevens maken: Azure OpenAI gebruiken om voorbeeldgegevens te genereren voor testen en ontwikkelen
  • Bewerkingen ongedaan maken: typ of selecteer Ongedaan maken om de laatste toegepaste stap te verwijderen
  • Valideren en controleren: Elke Copilot-actie wordt weergegeven als een antwoordkaart met bijbehorende stappen in de lijst toegepaste stappen

Zie Copilot voor Dataflow Gen2 voor meer informatie.

Wat moet u gebruiken voor gegevensstromen?

Voor dataflow Gen2 is een Fabric-capaciteit of een Fabric-proefcapaciteit vereist. Als u wilt weten hoe licenties werken voor gegevensstromen, bekijkt u de concepten en licenties van Microsoft Fabric.

Overstappen van Gegevensstroom Gen1 naar Gen2

Als u al gegevensstromen hebt gemaakt met Gen1, hoeft u zich geen zorgen te maken. U kunt ze eenvoudig migreren naar Gen2. We hebben verschillende opties om u te helpen de overstap te maken:

Uw query's exporteren en importeren

U kunt uw Dataflow Gen1-query's exporteren en opslaan in een PQT-bestand en ze vervolgens importeren in Dataflow Gen2. Zie De exportsjabloonfunctie gebruiken voor stapsgewijze instructies.

Kopiëren en plakken in Power Query

Als u een gegevensstroom in Power BI of Power Apps hebt, kunt u uw query's kopiëren en plakken in de Dataflow Gen2-editor. Met deze methode kunt u migreren zonder dat u uw query's helemaal opnieuw hoeft op te bouwen. Meer informatie: Bestaande Gegevensstroom Gen1-query's kopiëren en plakken.

De functie Opslaan als gebruiken

Als u al een type gegevensstroom (Gen1, Gen2 of Gen2 CI/CD) hebt, bevat Data Factory nu een functie Opslaan als. Hiermee kunt u elke bestaande gegevensstroom opslaan als een nieuw CI/CD-item (Dataflow Gen2) met slechts één actie. Meer informatie: migreren naar Dataflow Gen2 (CI/CD) met opslaan als.

Wilt u meer weten? Bekijk deze nuttige bronnen: