Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Feinabstimmung hilft Ihnen, vortrainierte KI-Modelle anzupassen, um besser mit Ihren spezifischen Daten und Anwendungsfällen zu arbeiten. Diese Technik kann die Modellleistung verbessern und gleichzeitig weniger Schulungsdaten benötigen als das Erstellen eines Modells von Grund auf neu.
Dieser Artikel befasst sich mit:
- Was Feinabstimmung ist und wie sie funktioniert
- Wann Feinabstimmungen gegenüber anderen Ansätzen verwendet werden sollten
- Auswählen und Vorbereiten von Modellen zur Feinabstimmung
- Bewährte Methoden zum Iterieren und Verbessern Ihrer Ergebnisse
Voraussetzungen
Bevor Sie beginnen, sollten Sie Folgendes haben:
- Grundlegendes Verständnis von Machine Learning-Konzepten
- Vertrautheit mit Ihren spezifischen Anwendungsfall- und Datenanforderungen
- Zugriff auf Beispieldaten für Schulungen und Validierung
Was ist Feinabstimmung?
Feinabstimmung ist eine maschinelle Lerntechnik, die ein vortrainiertes Modell anpasst, um Ihre spezifische Aufgabe besser auszuführen. Anstatt ein Modell von Grund auf neu zu trainieren, beginnen Sie mit einem Modell, das bereits allgemeine Muster versteht und es so anpasst, dass es mit Ihren Daten arbeitet.
Dieser Ansatz nutzt transferbezogenes Lernen – mithilfe von Erkenntnissen, die von einer Aufgabe gewonnen wurden, um die Leistung bei einer verwandten Aufgabe zu verbessern. Feinabstimmungen sind besonders effektiv, wenn Sie eingeschränkte Schulungsdaten haben oder auf vorhandenen Modellfunktionen aufbauen möchten.
Zeitpunkt der Feinabstimmung
Feinabstimmung ist besonders effektiv, wenn nur wenige Daten zur Verfügung stehen und Sie die Leistung Ihres Modells verbessern möchten. Indem Sie mit einem vorab trainierten Modell beginnen, können Sie das bereits gelernte Wissen verwenden und anpassen, um ihre Daten besser anzupassen. Dieser Ansatz hilft Ihnen, die Leistung Ihres Modells zu verbessern und die Menge der für die Schulung benötigten Daten zu reduzieren.
Wenn Sie über eine große Datenmenge verfügen, müssen Sie Ihr Modell normalerweise nicht optimieren. Sie können Ihr Modell von Grund auf neu trainieren und gute Resultate ohne Feineinstellung erzielen. Das Feintuning kann jedoch weiterhin hilfreich sein, wenn Sie die Leistung des Modells steigern möchten. Möglicherweise möchten Sie Ihr Modell auch optimieren, wenn Sie eine bestimmte Aufgabe haben, die sich von der Aufgabe unterscheidet, auf der das vortrainierte Modell ursprünglich trainiert wurde.
Sie können kostspielige Feinabstimmungen vermeiden, indem Sie Prompt-Engineering oder Prompt-Chaining verwenden. Diese Techniken helfen Ihnen, hochwertigen Text ohne Feinabstimmung zu erzeugen.
Wählen Sie ein vorab trainiertes Modell aus
Wählen Sie ein vordefiniertes Modell aus, das Ihren Aufgabenanforderungen entspricht. Viele vortrainierte Modelle sind verfügbar, die jeweils auf verschiedene Aufgaben trainiert wurden. Wählen Sie ein Modell aus, das auf einer Aufgabe trainiert wurde, die Ihren ähnelt. Diese Wahl hilft Ihnen, das Wissen zu verwenden, das das Modell bereits gelernt hat, und passt es an Ihre Daten an.
HuggingFace-Modelle sind ein guter Ausgangspunkt für die Suche nach vorab trainierten Modellen. Die HuggingFace Modelle werden basierend auf der Aufgabe, auf der sie trainiert wurden, in Kategorien gruppiert, wodurch es leicht ist, ein Modell zu finden, das zu Ihrer Aufgabe passt.
Zu diesen Kategorien zählen:
- Multimodale
- Maschinelles Sehen
- Verarbeitung natürlicher Sprache
- Audio
- Tabellarisch
- Vertiefendes Lernen
Überprüfen Sie, ob das Modell mit Ihrer Umgebung und Ihren Tools funktioniert. Wenn Sie Visual Studio Code beispielsweise (VS Code) verwenden, können Sie die Azure Machine Learning Erweiterung VS Code verwenden, um Ihr Modell zu optimieren.
Überprüfen Sie den Status und die Lizenz des Modells. Einige vortrainierte Modelle sind unter einer Open-Source-Lizenz verfügbar, während andere eine kommerzielle oder persönliche Lizenz benötigen. Alle Modelle in HuggingFace enthalten Lizenzinformationen. Stellen Sie sicher, dass Sie über die erforderlichen Berechtigungen zum Verwenden des Modells verfügen, bevor Sie es optimieren.
Bereiten Sie Ihre Beispieldaten vor
Das Vorbereiten Ihrer Beispieldaten umfasst das Bereinigen und das Vorverarbeiten Ihrer Daten, um sie für das Training geeignet zu machen. Sie sollten Ihre Daten auch in Trainings- und Validierungssätze aufteilen, um die Leistung Ihres Modells bewerten zu können. Das Format Ihrer Daten sollte mit dem format übereinstimmen, das von dem von Ihnen verwendeten vorab trainierten Modell erwartet wird. Sie finden diese Informationen mit den Modellen HuggingFace im Bereich "Anweisungsformat" der Modellkarte. Die meisten Modellkarten enthalten eine Vorlage zum Erstellen einer Eingabeaufforderung für das Modell und einige Pseudocode, die Ihnen bei den ersten Schritten helfen.
Durchlaufen des Modells
Nachdem Sie ihr Modell optimiert haben, bewerten Sie die Leistung des Überprüfungssatzes. Verwenden Sie Metriken wie Genauigkeit, Präzision, Recall und F1-Score, um die Leistung Ihres Modells zu bewerten. Wenn die Leistung Ihres Modells nicht zufriedenstellend ist, passen Sie die Hyperparameter an, ändern Sie die Architektur, oder optimieren Sie das Modell auf weitere Daten. Sie können auch die Qualität und Vielfalt Ihrer Daten untersuchen, um festzustellen, ob Probleme behoben werden müssen. In der Regel ist ein kleinerer Satz von qualitativ hochwertigen Daten wertvoller als eine größere Datenmenge mit niedriger Qualität.
Siehe auch
Weitere Informationen zur Feinabstimmung von KI-Modellen finden Sie in den folgenden Ressourcen:
- Optimieren eines Llama 2-Modells im Microsoft Foundry-Portal
- Optimierung eines vortrainierten Modells in HuggingFace
- Feinabstimmung eines vortrainierten Modells mit TensorFlow
Wenn Sie KI-Funktionen nutzen, überprüfen Sie bitte: Entwicklung von verantwortungsvollen generativen KI-Anwendungen und -Funktionen unter Windows.