Freigeben über


Modul 1: Erstellen einer Pipeline mit Data Factory

Dieses Modul dauert etwa 10 Minuten, bis es abgeschlossen ist. Sie werden Rohdaten aus dem Quellspeicher in eine Tabelle in der Bronzedatenschicht eines Data Lakehouse aufnehmen, indem Sie die Kopieraktivität in einer Pipeline verwenden.

Die übergeordneten Schritte in Modul 1 sind:

  1. Erstellen Sie eine Pipeline.
  2. Erstellen Sie "Kopieraktivität" in der Pipeline, um Beispieldaten in ein Data Lakehouse zu laden.
  3. Ausführen und Anzeigen der Ergebnisse der Kopieraktivität

Voraussetzungen

Erstellen einer Pipeline

  1. Melden Sie sich bei Power BI an.

  2. Wählen Sie unten links auf dem Bildschirm das Standardmäßige Power BI-Symbol aus, und wählen Sie "Fabric" aus.

  3. Wählen Sie auf der Registerkarte "Arbeitsbereiche" einen Arbeitsbereich aus oder wählen Sie "Mein Arbeitsbereich" aus, dann wählen Sie "+ Neues Element" und suchen Sie nach "Pipeline".

    Screenshot der Startseite

  4. Geben Sie einen Pipelinenamen an. Klicken Sie anschließend auf Erstellen.

Erstellen einer Kopieraktivität in der Pipeline zum Laden von Beispieldaten in ein Data Lakehouse

  1. Wählen Sie Kopierdaten-Assistent, um das Kopierassistent-Tool zu öffnen.

    Screenshot mit der Auswahl der Aktivität

  2. Wählen Sie auf der Seite " Datenquelle auswählen" die Option "Beispieldaten " aus den Optionen oben im Dialogfeld und dann "NYC Taxi - Grün" aus.

    Screenshot der Auswahl des NYC Taxi - Grüne Daten im Kopier-Assistenten auf der Registerkarte

  3. Die Datenquellenvorschau wird als Nächstes auf der Seite Mit Datenquelle verbinden angezeigt. Überprüfen Sie, und wählen Sie dann Weiteraus.

    Screenshot der Vorschaudaten für das NYC Taxi - Green Sample Dataset.

  4. Wählen Sie für den Schritt "Datenziel auswählen" des Kopier-Assistenten Lakehouse aus.

  5. Geben Sie einen Lakehouse-Namen ein, und wählen Sie dann "Erstellen und Verbinden" aus.

  6. Wählen Sie Verbinden aus.

  7. Wählen Sie " Vollkopie " für den Kopierauftragsmodus aus.

  8. Bei der Zuordnung zum Ziel wählen Sie Tabellen aus, wählen Sie Anfügen als Updatemethode, und bearbeiten Sie die Tabellenzuordnung so, dass die Zieltabelle Bronze genannt wird. Wählen Sie dann Weiter aus.

    Screenshot der Registerkarte "Mit dem Datenziel verbinden" des Assistenten zum Kopieren von Daten im Schritt "Ordnerpfad oder Tabelle auswählen und zuordnen".

  9. Überprüfen Sie auf der Seite "Überprüfen + Speichern " des Assistenten zum Kopieren von Daten die Konfiguration, und wählen Sie dann "Speichern" aus.

  10. Wählen Sie die Kopierauftragsaktivität auf dem Pipeline-Zeichenbereich aus, und wählen Sie dann die Registerkarte "Einstellungen " unter dem Zeichenbereich aus.

    Screenshot des Pipeline-Arbeitsbereichs mit markierter Kopierauftragsaktivität und hervorgehobener Registerkarte

  11. Wählen Sie die Dropdownliste "Verbindung" und dann "Alle durchsuchen" aus.

    Screenshot der Liste der Einstellungen für Kopieraufträge mit hervorgehobener Option

  12. Wählen Sie unter "Neue Quellen" den Kopierauftrag aus.

  13. Wählen Sie auf der Seite "Datenquelle verbinden " die Option " Anmelden " aus, um die Verbindung zu authentifizieren.

    Screenshot der Seite

  14. Folgen Sie den Anweisungen, um sich bei Ihrem Organisationskonto anzumelden.

  15. Wählen Sie "Verbinden" aus, um die Verbindungseinrichtung abzuschließen.

  16. Wählen Sie oben im Pipeline-Editor "Speichern" aus, um die Pipeline zu speichern.

Ausführen und Anzeigen der Ergebnisse Ihrer Kopieraktivität

  1. Wählen Sie oben im Pipeline-Editor "Ausführen" aus, um die Pipeline auszuführen und die Daten zu kopieren.

    Hinweis

    Dieser Vorgang kann mehr als 30 Minuten dauern.

    Screenshot des Pipeline-Editors mit hervorgehobener Schaltfläche

  2. Sie können die Ausführung überwachen und die Ergebnisse auf der Registerkarte Ausgabe unterhalb der Pipelinecanvas überprüfen. Wählen Sie den Namen der Pipeline aus, um die Ausführungsdetails anzuzeigen.

    Screenshot der Schaltfläche

Nächster Schritt

Sobald der Kopiervorgang abgeschlossen ist, kann es etwa eine halbe Stunde dauern, gehen Sie zum nächsten Abschnitt über, um Ihren Datenfluss zu erstellen.