Freigeben über


Konfigurieren des Modus für hohe Parallelität für Fabric-Notebooks

Wenn Sie ein Notebook in Microsoft Fabric ausführen, wird eine Apache Spark-Sitzung gestartet und zur Ausführung der Abfragen verwendet, die im Rahmen der Ausführung von Notebookzellen übermittelt werden. Wenn der Modus für hohe Parallelität aktiviert ist, müssen keine neuen Spark-Sitzungen jedes Mal gestartet werden, um ein Notizbuch auszuführen.

Wenn bereits eine hohe Parallelitätssitzung ausgeführt wird, können Sie Notizbücher an die hohe Parallelitätssitzung anhängen, um sofort eine Spark-Sitzung aufzubauen, die Abfragen auszuführen und eine höhere Sitzungsauslastung zu erzielen.

Animation einer Sitzung mit hoher Parallelität für Notizbücher.

Hinweis

Die auf dem Modus für hohe Parallelität basierende Sitzungsfreigabe erfolgt immer innerhalb einer einzelnen Benutzergrenze. Die Notebooks müssen identische Spark-Konfigurationen aufweisen, sollten demselben Arbeitsbereich angehören, dasselbe standardmäßige Lakehouse und dieselben Standardbibliotheken verwenden, um eine einzelne Spark-Sitzung gemeinsam zu nutzen.

Bedingungen für die Sitzungsfreigabe

Damit Notebooks eine einzelne Spark-Sitzung freigeben können, müssen sie:

  • Vom/von der selben Benutzer*in ausgeführt werden.
  • Über das gleiche Standardlakehouse verfügen. Notebooks ohne Standardlakehouse können Sitzungen mit anderen Notebooks teilen, die nicht über ein Standardlakehouse verfügen.
  • Dieselben Spark-Computekonfigurationen aufweisen.
  • Dieselben Bibliothekspakete auf aufweisen. Du kannst unterschiedliche Inlinebibliotheksinstallationen als Teil von Notebookzellen verwenden und die Sitzung weiterhin mit Notebooks teilen, die unterschiedliche Bibliotheksabhängigkeiten aufweisen.

Konfigurieren des Modus für hohe Parallelität

Standardmäßig sind alle Fabric-Arbeitsbereiche mit hohem Parallelitätsmodus aktiviert. Führen Sie die folgenden Schritte aus, um das Feature für hohe Parallelität zu konfigurieren:

  1. Klicken Sie in Ihrem Fabric-Arbeitsbereich auf die Option "Arbeitsbereichseinstellungen ".

  2. Navigieren Sie zum Abschnitt Data Engineering/Science unter > und hohe Parallelität.

  3. Aktivieren Sie im Abschnitt "Hohe Parallelität " die Einstellung "Für Notizbücher ". Sie können die Einstellung in diesem Bereich aktivieren oder deaktivieren .

    Screenshot, der den Abschnitt „Hohe Parallelität“ in den Arbeitsbereichseinstellungen zeigt.

  4. Wenn Sie die Option für hohe Parallelität aktivieren, können Benutzer*innen eine Sitzung mit hoher Parallelität auf ihren Notebooks starten oder das Notebook an eine vorhandene Sitzung mit hoher Parallelität anfügen.

  5. Wenn Sie den Modus für hohe Parallelität deaktivieren, wird der Abschnitt zum Konfigurieren des Zeitraums der Inaktivität ausgeblendet, und die Option zum Starten einer neuen Sitzung mit hoher Parallelität wird ebenfalls nicht mehr im Notebookmenü angezeigt.

    Screenshot der Option für hohe Parallelität, die in den Arbeitsbereichseinstellungen deaktiviert ist.

Ausführen von Notebooks in einer Sitzung mit hoher Parallelität

  1. Öffnen Sie den Fabric-Arbeitsbereich.

  2. Erstellen Sie ein Notizbuch, oder öffnen Sie ein vorhandenes Notizbuch.

  3. Navigieren Sie im Menüband zur Registerkarte " Ausführen ", und wählen Sie das Dropdownmenü "Sitzungstyp " aus, das "Standard" als Standardoption ausgewählt hat.

    Screenshot der Option

  4. Wählen Sie Neue Sitzung mit hoher Parallelität aus.

  5. Nachdem die Sitzung mit hoher Parallelität gestartet wurde, können Sie der Sitzung mit hoher Parallelität nun bis zu 5 Notebooks hinzufügen.

    Screenshot mit der Option zum Starten einer neuen Sitzung mit hoher Parallelität im Menü

  6. Erstellen Sie ein neues Notebook, und navigieren Sie zum Menü Ausführen wie in den oben beschriebenen Schritten. Im Dropdownmenü wird jetzt die neu erstellte Sitzung mit hoher Parallelität angezeigt.

  7. Wenn Sie die vorhandene Sitzung mit hoher Parallelität auswählen, wird das zweite Notebook an die Sitzung angefügt.

    Screenshot der Option zum Anfügen an eine vorhandene Sitzung mit hoher Parallelität im Menü

  8. Nachdem das Notebook angefügt wurde, können Sie sofort mit der Ausführung der Notebookschritte beginnen.

  9. Der Sitzungsstatus mit hoher Parallelität zeigt auch die Anzahl der Notebooks an, die zum jeweiligen Zeitpunkt an eine bestimmte Sitzung angefügt sind.

  10. Wenn zu irgendeinem Zeitpunkt das an eine Sitzung mit hoher Parallelität angefügte Notizbuch mehr dedizierte Rechenleistung erfordert, können Sie das Notizbuch zu einer Standardsitzung übertragen, indem Sie auf der Registerkarte "Start" die Option auswählen, das Notizbuch von der hohe Parallelitätssitzung zu trennen.

    Screenshot der Option zum Trennen von einer Sitzung mit hoher Parallelität im Menü

  11. Sie können den Sitzungsstatus, den Typ und die ID in der Statusleiste anzeigen. Wählen Sie die Sitzungs-ID aus, um die in dieser Sitzung mit hoher Parallelität ausgeführten Aufträge zu erkunden und Protokolle der Spark-Sitzung auf der Überwachungsdetailseite anzuzeigen.

    Screenshot mit den Sitzungsdetails einer Sitzung mit hoher Parallelität im Menü

Sie können auch den Modus für hohe Parallelität für Notizbücher in Pipelines konfigurieren und Sitzungstags verwenden, um freigegebene Sitzungen zu gruppieren.

Überwachen und Debuggen von Notebooks, die in einer Sitzung mit hoher Parallelität ausgeführt werden

Überwachung und Debugging sind oftmals nicht einfach, wenn Sie mehrere Notebooks in einer freigegebenen Sitzung ausführen. Für den Modus für hohe Parallelität in Fabric wird eine Trennung der Protokolle angeboten, die es den Benutzer*innen ermöglicht, die durch Spark-Ereignisse ausgegebenen Protokolle verschiedener Notebooks nachzuverfolgen.

  1. Bei laufenden oder abgeschlossenen Sitzungen können Sie den Sitzungsstatus anzeigen, indem Sie zum Menü Ausführen navigieren und die Option Alle Ausführungen auswählen.

  2. Dadurch wird der Ausführungsverlauf des Notebooks mit einer Liste der aktuell aktiven und historischen Spark-Sitzungen geöffnet.

    Screenshot, der die Seite „Alle Ausführungen“ für ein Notebook in einer Sitzung mit hoher Parallelität zeigt.

  3. Benutzer*innen können durch Auswahl einer Sitzung zur Ansicht mit den Überwachungsdetails wechseln, die eine Liste aller Spark-Aufträge anzeigt, die in der Sitzung ausgeführt wurden.

  4. Im Falle einer Sitzung mit hoher Parallelität können Benutzer*innen die Aufträge und die zugehörigen Protokolle aus verschiedenen Notebooks über die Registerkarte Zugehörige Notebooks identifizieren, die das Notebook anzeigt, von dem aus der Auftrag ausgeführt wurde.

    Screenshot, der alle zugehörigen Notebooks für eine Sitzung mit hoher Parallelität in der Ansicht mit den Überwachungsdetails zeigt.

In diesem Dokument haben Sie die Grundlagen der Freigabe von Sitzungen durch den Modus für hohe Parallelität in Notebooks kennengelernt. Fahren Sie mit den nächsten Artikeln fort, um zu erfahren, wie Sie mit Lakehouse und Notebooks Ihre eigenen Datentechnikumgebungen erstellen und erste Schritte unternehmen können: