Erste Schritte mit Azure Databricks
Um Azure Databricks zu verwenden, müssen Sie einen Azure Databricks-Arbeitsbereich in Ihrem Azure-Abonnement erstellen. Ein Arbeitsbereich ist eine Azure Databricks-Bereitstellung in einem Clouddienstkonto. Er bietet eine einheitliche Umgebung für die Arbeit mit Azure Databricks-Ressourcen für eine bestimmte Gruppe von Benutzern.
Sie können einen Azure Databricks-Arbeitsbereich erstellen, indem Sie:
- Verwenden der Benutzeroberfläche des Azure-Portals.
- Verwendung einer Azure Resource Manager (ARM)-, Bicep- oder Terraform-Vorlage.
- Verwenden des New-AzDatabricksWorkspace Azure PowerShell-Cmdlets.
- Erstellen Sie mithilfe des Az databricks-Arbeitsbereichs den Befehl "Azure command line interface(CLI)".
Wenn Sie einen Arbeitsbereich erstellen, müssen Sie Folgendes angeben:
- Ein Arbeitsbereichsname.
- Wählen Sie eine verfügbare Region aus. Verfügbare Regionen finden Sie unter Azure-Dienste, die nach Region verfügbar sind.
- Ein Preisniveau:
- Standard – Core Apache Spark-Funktionen mit Microsoft Entra ID-Integration.
- Premium – Rollenbasierte Zugriffssteuerungen und andere Features auf Unternehmensebene.
- Testversion – Eine 14-tägige kostenlose Testversion eines Premium-Level-Arbeitsbereichs
- Name der verwalteten Ressourcengruppe (optional): eine automatisch erstellte Ressourcengruppe, in der Azure die für Ihren Databricks-Arbeitsbereich erforderlichen Infrastrukturressourcen bereit stellt und verwaltet.
Wenn Sie eine Azure Databricks-Bereitstellung mithilfe der Azure CLI erstellen möchten, wäre dies der Az databricks-Arbeitsbereichsbefehl , den Sie sich merken sollten:
az databricks workspace create
--resource-group myresourcegroup \
--name mydatabricksws \
--location westus2 \
--sku standard
Das entsprechende New-AzDatabricksWorkspace PowerShell-Cmdlet :
New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard
Navigieren in der Benutzeroberfläche des Azure Databricks-Arbeitsbereichs
Nachdem Sie einen Azure Databricks-Arbeitsbereich bereitgestellt haben, können Sie die Arbeitsbereichs-UI verwenden, um mit Daten und Computeressourcen zu arbeiten. Die Arbeitsbereich-UI ist eine webbasierte Benutzeroberfläche, auf der Sie Arbeitsbereichsressourcen wie Spark-Cluster erstellen und verwalten können, und Notizbücher und Abfragen verwenden, um mit Daten in Dateien und Tabellen zu arbeiten.
Die Homepage bietet Verknüpfungen zu allgemeinen Aufgaben- und Arbeitsbereichsobjekten, die Ihnen bei den ersten Schritten helfen. Sie können Daten importieren, ein Notizbuch erstellen, eine Abfrage erstellen und ein AutoML-Experiment konfigurieren.
Die Sidebar zeigt allgemeine Databricks-Kategorien (Arbeitsbereich, Zuletzt verwendet, Katalog, Jobs & Pipelines, Compute, Marketplace). Es bricht dann nach Produktbereich auf:
- SQL: SQL-Editor, Abfragen, Dashboards, Genie, Warnungen, Abfrageverlauf, SQL Warehouses
- Data Engineering: Auftragsausführung, Datenaufnahme
- Maschinelles Lernen: Spielplatz, Experimente, Funktionen, Modelle, Bereitstellung
Wählen Sie +Neu aus, um:
- Erstellen von Arbeitsbereichsobjekten wie Notizbüchern, Abfragen, Repos, Dashboards, Warnungen, Aufträgen, Pipelines, Experimenten, Modellen und Bereitstellung von Endpunkten.
- Erstellen Sie Computeressourcen wie Cluster, SQL-Lagerhäuser und ML-Endpunkte.
Verwenden Sie die obere Leiste, um nach Arbeitsbereichsobjekten wie Notizbüchern, Abfragen, Dashboards, Warnungen, Dateien, Ordnern, Bibliotheken, Tabellen zu suchen , die in Unity-Katalog, Aufträgen und Repositorys an einem zentralen Ort registriert sind. Sie können auch auf zuletzt angezeigte Objekte in der Suchleiste zugreifen.
Der Arbeitsbereich ist in mehreren Sprachen verfügbar. Um die Arbeitsbereichssprache zu ändern, wählen Sie Ihren Benutzernamen in der oberen Navigationsleiste aus, wählen Sie "Einstellungen" aus, und wechseln Sie zur Registerkarte " Einstellungen ".
Hilfe vom Databricks-Assistenten erhalten
Databricks Assistant ist ein KI-gesteuertes Paarprogrammierer- und Supporttool, mit dem Sie effizienter in Databricks arbeiten können, indem Code oder Abfragen direkt in Notebooks, Dashboards und Dateien generiert, erläutert und behoben werden.
Sie kann bei einer breiten Palette von Aufgaben helfen, darunter das Identifizieren und Korrigieren von Fehlern, das Erstellen von Datenvisualisierungen, das Diagnostizieren von Auftragsproblemen und das Filtern oder Analysieren von Daten mithilfe von Eingabeaufforderungen in natürlicher Sprache. Der Assistent kann relevante Anleitungen aus der Azure Databricks-Dokumentation anzeigen.
Mithilfe von Unity-Katalogmetadaten personalisiert es seine Antworten basierend auf den Datenressourcen Ihrer Organisation – Tabellen, Spalten und Beschreibungen – und erleichtert das Durchsuchen und Arbeiten mit Ihren Daten.