Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Gebruik de notebook-taak om Databricks-notebooks te implementeren.
Een notebooktaak configureren
Voordat u begint, moet u uw notitieblok op een locatie hebben die toegankelijk is voor de gebruiker die de taak configureert.
Notitie
In de gebruikersinterface voor taken worden opties dynamisch weergegeven op basis van andere geconfigureerde instellingen.
Start de procedure om een Notebook taak te configureren.
- Navigeer naar het tabblad Taken in de gebruikersinterface.
- Klik op Taak toevoegen.
- Voer een naam in het veld Taaknaam in.
- In de Type-keuzelijst, selecteer
Notebook.
De bron configureren
Selecteer in de vervolgkeuzelijst Bron een locatie voor het Python-script met behulp van een van de volgende opties.
Werkplek
Gebruik Werkruimte om een notebook te configureren dat is opgeslagen in de werkruimte door de volgende stappen uit te voeren:
- Klik op het Pad veld. Het dialoogvenster Selecteer Notitieblok wordt weergegeven.
- Blader naar het notitieblok, klik om het bestand te markeren en klik op Bevestigen.
Notitie
U kunt deze optie gebruiken om een taak te configureren voor een notebook dat is opgeslagen in een Databricks Git-map. Databricks raadt aan om de optie voor de Git-provider en een externe Git-opslagplaats te gebruiken voor het versiebeheer van assets die gepland zijn met taken.
Gitprovider
Gebruik de Git-provider om een notebook te configureren in een externe Git-opslagplaats.
De opties die door de gebruikersinterface worden weergegeven, zijn afhankelijk van of u al dan niet ergens anders een Git-provider hebt geconfigureerd. Er kan slechts één externe Git-opslagplaats worden gebruikt voor alle taken in een taak. Zie Git gebruiken met werkzaamheden.
Belangrijk
Notebooks die zijn gemaakt door Lakeflow-taken die worden uitgevoerd vanuit externe Git-opslagplaatsen, zijn kortstondig en kunnen niet worden gebruikt om MLflow-uitvoeringen, experimenten of modellen bij te houden. Wanneer u een notebook maakt vanuit een taak, gebruikt u een MLflow-werkruimte-experiment (in plaats van een MLflow-notebookexperiment) en roept u mlflow.set_experiment("/path/to/experiment") aan in het werkruimtenotitieblok voordat u enige MLflow-traceringscode uitvoert. Zie Gegevensverlies voorkomen in MLflow-experimenten voor meer informatie.
Het veld Pad wordt weergegeven nadat u een Git-verwijzing hebt geconfigureerd.
Voer het relatieve pad voor uw notitieblok in, zoals etl/bronze/ingest.py.
Belangrijk
Wanneer u het relatieve pad invoert, begint u niet met / of ./. Als het absolute pad voor het notitieblok dat u wilt openen bijvoorbeeld is /etl/bronze/ingest.py, voert etl/bronze/ingest.py u dit in het veld Pad in.
Reken- en afhankelijke bibliotheken configureren
- Gebruik Compute om een cluster te selecteren of te configureren dat ondersteuning biedt voor de logica in uw notebook.
- Als u rekenkracht gebruikt
Serverless, installeert u bibliotheken rechtstreeks in notebooks, met behulp van het deelvenster Omgeving of met behulp van%pip install. Zie De serverloze omgeving configureren. - Klik voor alle andere rekenconfiguraties op + Toevoegen onder Afhankelijke bibliotheken. Het dialoogvenster Afhankelijke bibliotheek toevoegen wordt weergegeven.
- U kunt een bestaande bibliotheek selecteren of een nieuwe bibliotheek uploaden.
- U kunt alleen bibliotheken gebruiken die zijn opgeslagen op een locatie die wordt ondersteund door uw rekenconfiguraties. Zie ondersteuning voor Python-bibliotheken.
- Elke bibliotheekbron heeft een andere stroom voor het selecteren of uploaden van een bibliotheek. Zie Bibliotheken installeren.
Taakconfiguratie voltooien
- (Optioneel) Configureer parameters als sleutel-waardeparen die kunnen worden geopend in het notebook met behulp van
dbutils.widgets. Zie configureer taakparameters. - Klik op Taak opslaan.
Beperkingen
De totale uitvoer van notebookcellen (de gecombineerde uitvoer van alle notebookcellen) is onderworpen aan een maximale grootte van 20 MB. Daarnaast is de uitvoer van afzonderlijke cellen onderworpen aan een maximale grootte van 8 MB. Als de totale celuitvoer groter is dan 20 MB of als de uitvoer van een afzonderlijke cel groter is dan 8 MB, wordt de uitvoering geannuleerd en gemarkeerd als mislukt.
Als u hulp nodig hebt bij het vinden van cellen die zich in de buurt van of buiten de limiet bevinden, voert u het notebook uit op een universele cluster en gebruikt u deze notebook autosave-techniek.