Modelle für maschinelles Lernen
Hinweis
Weitere Details finden Sie auf der Registerkarte "Text und Bilder ".
Da maschinelles Lernen auf Mathematik und Statistik basiert, ist es üblich, sich in mathematischen Ausdrücken an Machine Learning-Modelle zu denken. Grundsätzlich ist ein Machine Learning-Modell eine Softwareanwendung, die eine Funktion kapselt, um einen Ausgabewert basierend auf einem oder mehreren Eingabewerten zu berechnen. Der Prozess der Definition dieser Funktion wird als Schulung bezeichnet. Nachdem die Funktion definiert wurde, können Sie sie verwenden, um neue Werte in einem Prozess vorherzusagen, der als Ableitung bezeichnet wird.
Sehen wir uns die Schritte an, die bei der Schulung und Schlussfolgerung von Bedeutung sind.
Die Schulungsdaten bestehen aus früheren Beobachtungen. In den meisten Fällen umfassen die Beobachtungen die beobachteten Attribute oder Merkmale der beobachteten Sache und den bekannten Wert der Sache, die Sie trainieren möchten, um ein Modell vorherzusagen (als Bezeichnung bezeichnet).
In mathematischen Ausdrücken werden häufig die Features angezeigt, auf die mit dem Kurzschriftvariablennamen "x" und der Bezeichnung " y" verwiesen wird. In der Regel besteht eine Beobachtung aus mehreren Featurewerten, daher ist x tatsächlich ein Vektor (ein Array mit mehreren Werten), wie folgt: [x1,x2,x3,...].
Um dies klarer zu machen, betrachten wir die zuvor beschriebenen Beispiele:
- Im Szenario des Eisverkaufs ist es unser Ziel, ein Modell zu trainieren, das die Anzahl der Eisverkäufe basierend auf dem Wetter vorhersagen kann. Die Wettermessungen für den Tag (Temperatur, Niederschlag, Windgeschwindigkeit usw.) wären die Merkmale (x), und die Anzahl der am Tag verkauften Eiscremes wäre das Etikett (y).
- Im medizinischen Szenario soll vorhergesagt werden, ob ein Patient aufgrund seiner klinischen Messungen ein Risiko für Diabetes hat oder nicht. Die Messungen des Patienten (Gewicht, Blutzucker usw.) sind die Merkmale (x), und die Wahrscheinlichkeit von Diabetes (z. B. 1 für risikobehaftet, 0 für nicht gefährdet) ist das Etikett (y).
- Im Antarktisforschungsszenario wollen wir die Arten eines Pinguins anhand seiner physikalischen Attribute vorhersagen. Die Schlüsselmaße des Pinguins (Länge seiner Flossen, Breite seines Schnabels usw.) sind die Merkmale (x), und die Art (z. B. 0 für Adéliepinguin, 1 für Eselspinguin oder 2 für Zügelpinguin) ist die Bezeichnung (y).
Ein Algorithmus wird auf die Daten angewendet, um zu versuchen, eine Beziehung zwischen den Features und der Bezeichnung zu ermitteln, und generalisieren Sie diese Beziehung als Berechnung, die für x zum Berechnen von y ausgeführt werden kann. Der verwendete spezifische Algorithmus hängt von der Art des prädiktiven Problems ab, das Sie lösen möchten (mehr dazu später), aber das Grundprinzip besteht darin, die Daten an eine Funktion anzupassen , in der die Werte der Features zum Berechnen der Bezeichnung verwendet werden können.
Das Ergebnis des Algorithmus ist ein Modell , das die vom Algorithmus abgeleitete Berechnung als Funktion kapselt – nennen wir es f. In mathematischer Schreibweise:
y = f(x)
Nachdem die Schulungsphase abgeschlossen ist, kann das trainierte Modell für die Ableitung verwendet werden. Das Modell ist im Wesentlichen ein Softwareprogramm, das die vom Schulungsvorgang erzeugte Funktion kapselt. Sie können einen Satz von Featurewerten eingeben und als Ausgabe eine Vorhersage der entsprechenden Bezeichnung erhalten. Da die Ausgabe des Modells eine Vorhersage ist, die von der Funktion berechnet wurde und kein beobachteter Wert ist, wird die Ausgabe der Funktion häufig als ŷ dargestellt (vergnüglich als "y-hat" verbalisiert).