Freigeben über


Trainieren von Modellen mit Azure Machine Learning (v1)

GILT FÜR:Azure Machine Learning SDK v1 für Python

Important

Dieser Artikel enthält Informationen zur Verwendung des Azure Machine Learning SDK v1. SDK v1 ist ab dem 31. März 2025 veraltet. Der Support für sie endet am 30. Juni 2026. Sie können SDK v1 bis zu diesem Datum installieren und verwenden. Ihre vorhandenen Workflows mit SDK v1 funktionieren weiterhin nach dem Enddatum des Supports. Sie können jedoch Sicherheitsrisiken oder Breaking Changes im Falle von Architekturänderungen im Produkt ausgesetzt sein.

Es wird empfohlen, vor dem 30. Juni 2026 zum SDK v2 zu wechseln. Weitere Informationen zu SDK v2 finden Sie unter Was ist Azure Machine Learning CLI und Python SDK v2? und die SDK v2-Referenz.

Azure Machine Learning bietet mehrere Möglichkeiten zum Trainieren von Modellen, einschließlich Code-first-Lösungen mit dem SDK und Low-Code-Optionen wie automatisiertem Maschinellem Lernen und dem visuellen Designer. Verwenden Sie die folgende Liste, um zu bestimmen, welche Schulungsmethode Ihren Anforderungen entspricht:

  • Azure Machine Learning SDK für Python: Das Python SDK bietet verschiedene Möglichkeiten, Modelle mit jeweils unterschiedlichen Funktionen zu trainieren.

    Trainingsmethode Description
    Ausführen der Konfiguration Eine gängige Methode zum Trainieren von Modellen besteht darin, ein Schulungsskript und eine Auftragskonfiguration zu verwenden. Die Auftragskonfiguration definiert die Schulungsumgebung, einschließlich Ihres Skripts, des Computeziels und der Azure Machine Learning-Umgebung. Sie können einen Schulungsauftrag ausführen, indem Sie diese Details angeben.
    Automatisiertes maschinelles Lernen Mit automatisiertem maschinellem Lernen können Sie Modelle ohne umfassende Data Science- oder Programmierkenntnisse trainieren. Für erfahrene Benutzer spart es Zeit, indem Algorithmusauswahl und Hyperparameteroptimierung automatisiert werden. Die Jobkonfiguration ist bei Verwendung des automatisierten maschinellen Lernens nicht erforderlich.
    Machine Learning-Pipeline Pipelines sind keine separate Schulungsmethode, sondern eine Möglichkeit, Workflows mithilfe modularer, wiederverwendbarer Schritte zu definieren, die Schulungen enthalten können. Pipelines unterstützen sowohl die automatisierte Machine Learning- als auch die Ausführungskonfiguration. Verwenden Sie eine Pipeline, wenn Sie Folgendes ausführen möchten:
    * Planen Sie unbeaufsichtigte Prozesse wie lange laufende Schulungsaufträge oder Datenvorbereitungen.
    * Koordinieren Sie mehrere Schritte über verschiedene Rechenressourcen und Speicherorte hinweg.
    * Erstellen Sie eine wiederverwendbare Vorlage für Szenarien wie umschulungen oder Batchbewertungen.
    * Nachverfolgung und Versionierung von Datenquellen, Eingaben und Ausgaben für Ihren Workflow.
    * Ermöglichen Sie verschiedenen Teams, unabhängig an bestimmten Schritten zu arbeiten und sie in einer Pipeline zu kombinieren.
  • Designer: Azure Machine Learning-Designer ist ein einfacher Einstiegspunkt zum Erstellen von Konzepten oder für Benutzer mit eingeschränkter Codierungserfahrung. Trainieren von Modellen mithilfe einer Drag-and-Drop-Web-UI. Sie können Python-Code oder Trainmodelle einschließen, ohne Code zu schreiben.

  • Azure CLI: Die Machine Learning CLI bietet Befehle für allgemeine Azure Machine Learning-Aufgaben und wird häufig für Skripts und Automatisierung verwendet. Beispielsweise können Sie nach dem Erstellen eines Schulungsskripts oder einer Pipeline die CLI verwenden, um einen Schulungsauftrag nach einem Zeitplan zu starten oder wenn Schulungsdaten aktualisiert werden. Die CLI kann Aufträge mithilfe von Ausführungskonfigurationen oder Pipelines übermitteln.

Jede Schulungsmethode kann verschiedene Arten von Computeressourcen verwenden, die als Computeziele bezeichnet werden. Ein Computeziel kann ein lokaler Computer oder eine Cloudressource sein, z. B. Azure Machine Learning Compute, Azure HDInsight oder ein virtueller Remotecomputer.

Python SDK

Mit dem Azure Machine Learning SDK für Python können Sie Machine Learning-Workflows erstellen und ausführen. Sie können mit dem Dienst über eine interaktive Python-Sitzung, Jupyter Notebooks, Visual Studio Code oder eine andere integrierte Entwicklungsumgebung (IDE) interagieren.

Konfiguration ausführen

Ein typischer Schulungsauftrag in Azure Machine Learning wird mithilfe von ScriptRunConfig definiert. Die Skriptausführungskonfiguration wird zusammen mit Ihren Trainingsskripten verwendet, um ein Modell auf einem Zielcomputer zu trainieren.

Sie können mit einer Ausführungskonfiguration für Ihren lokalen Computer beginnen und nach Bedarf zu einem cloudbasierten Computeziel wechseln. Aktualisieren Sie die Ausführungskonfiguration, um das Computeziel zu ändern. Jede Ausführung protokolliert Informationen zum Schulungsauftrag, einschließlich Eingaben, Ausgaben und Protokollen.

Automatisiertes maschinelles Lernen

Definieren Sie Iterationen, Hyperparametereinstellungen, Featurierung und andere Optionen. Während der Schulung testet Azure Machine Learning verschiedene Algorithmen und Parameter parallel. Die Schulung wird beendet, wenn sie die von Ihnen festgelegten Beendigungskriterien erfüllt.

Tip

Sie können automatisierte ML auch über Das Azure Machine Learning Studio zusätzlich zum Python SDK verwenden.

Machine Learning-Pipeline

Machine Learning-Pipelines können die oben beschriebenen Schulungsmethoden verwenden. Pipelines konzentrieren sich auf die Erstellung von Workflows, sodass sie mehr als nur Modellschulungen abdecken. In einer Pipeline können Sie ein Modell mit automatisiertem maschinellen Lernen oder Laufzeitkonfigurationen trainieren.

Verstehen, was beim Übermitteln eines Trainingsauftrags passiert

Der Azure-Schulungslebenszyklus umfasst:

  1. Komprimieren der Dateien in Ihrem Projektordner, wobei die in .amlignore oder .gitignore angegebenen zu ignorieren sind.
  2. Hochskalieren Ihres Computeclusters
  3. Erstellen oder Herunterladen des Docker-Images für den Computeknoten
    1. Das System berechnet einen Hashwert aus:
    2. Das System verwendet diesen Hash, um den Arbeitsbereich Azure Container Registry (ACR) nachzuschlagen.
    3. Falls nicht gefunden, wird das globale ACR überprüft.
    4. Wenn es immer noch nicht gefunden wird, erstellt das System ein neues Image, das zwischengespeichert und im Arbeitsbereich-ACR registriert wird.
  4. Herunterladen der gezippten Projektdatei in den temporären Speicher auf dem Computeknoten
  5. Entzippen der Projektdatei
  6. Der Computerknoten führt python <entry script> <arguments> aus
  7. Speichern von Protokollen, Modelldateien und anderen Dateien, die in dem Speicherkonto, das dem Arbeitsbereich zugeordnet ist, in ./outputs geschrieben werden
  8. Herunterskalieren der Computevorgänge, einschließlich Entfernen des temporären Speichers

Wenn Sie auf Ihrem lokalen Computer trainieren ("als lokale Ausführung konfigurieren"), ist Docker nicht erforderlich. Sie können Docker lokal verwenden, wenn Sie es bevorzugen (siehe Konfigurieren der ML-Pipeline für ein Beispiel).

Azure Machine Learning-Designer

Mit dem Designer können Sie Modelle mit einer Drag-and-Drop-Schnittstelle in Ihrem Webbrowser trainieren.

Azure CLI

Die Machine Learning-Befehlszeilenschnittstelle ist eine Erweiterung für die Azure-Befehlszeilenschnittstelle. Es bietet plattformübergreifende Befehle für die Arbeit mit Azure Machine Learning. In der Regel verwenden Sie die Befehlszeilenschnittstelle zur Automatisierung von Aufgaben, z. B. das Training eines Machine Learning-Modells.

Nächste Schritte

Erfahren Sie, wie Sie eine Schulungsausführung konfigurieren.