Modèles Machine Learning

5 minutes

Note

Pour plus d’informations, consultez l’onglet Texte et images !

Étant donné que le Machine Learning est basé sur les mathématiques et les statistiques, il est courant de réfléchir aux modèles machine learning en termes mathématiques. En fait, un modèle Machine Learning est une application logicielle qui encapsule une fonction pour calculer une valeur de sortie basée sur une ou plusieurs valeurs d’entrée. Le processus de définition de cette fonction est appelé entraînement. Une fois la fonction définie, vous pouvez l’utiliser pour prédire de nouvelles valeurs dans un processus appelé inférence.

Examinons les étapes impliquées dans la formation et l’inférence.

Diagramme montrant les phases d’apprentissage et d’inférence dans le Machine Learning.

Les données d’apprentissage se composent d’observations passées. Dans la plupart des cas, les observations incluent les attributs ou caractéristiques observés de l’élément observé et la valeur connue de la chose que vous souhaitez entraîner pour prédire un modèle (appelé étiquette).

En termes mathématiques, vous verrez souvent les fonctionnalités référencées à l’aide du nom de variable abrégée x et de l’étiquette appelée y. En règle générale, une observation se compose de plusieurs valeurs de caractéristiques, donc x est en fait un vecteur (tableau avec plusieurs valeurs), comme suit : [x_1,x_2,x₃,...].

Pour plus de clarté, examinons les exemples décrits précédemment :
- Dans le scénario de vente de crème glacée, notre objectif est d’entraîner un modèle qui peut prédire le nombre de ventes de crème glacée en fonction du temps. Les mesures météorologiques de la journée (température, pluie, vitesse du vent, etc.) seraient les caractéristiques (x) et le nombre de glaces vendues chaque jour serait l’étiquette (y).
- Dans le scénario médical, l’objectif est de prédire si un patient est à risque de diabète en fonction de ses mesures cliniques. Les mesures du patient (poids, taux de glucose sanguin, etc.) sont les caractéristiques (x) et la probabilité de diabète (par exemple, 1 pour le risque, 0 pour non à risque) est l’étiquette (y).
- Dans le scénario de recherche antarctique, nous voulons prédire l’espèce d’un pingouin en fonction de ses attributs physiques. Les mesures clés du pingouin (longueur de ses ailes, largeur de son bec, etc.) sont les caractéristiques (x) et les espèces (par exemple, 0 pour Adelie, 1 pour Gentoo ou 2 pour Chinstrap) sont l’étiquette (y).
Un algorithme est appliqué aux données pour tenter de déterminer une relation entre les caractéristiques et l’étiquette, et généralise cette relation en tant que calcul pouvant être effectué sur x pour calculer y. L’algorithme spécifique utilisé dépend du type de problème prédictif que vous essayez de résoudre (plus loin), mais le principe de base consiste à essayer d’adapter les données à une fonction dans laquelle les valeurs des fonctionnalités peuvent être utilisées pour calculer l’étiquette.
Le résultat de l’algorithme est un modèle qui encapsule le calcul dérivé de l’algorithme en tant que fonction . Nous allons l’appeler f. En notation mathématique :

y = f(x)
Maintenant que la phase d’entraînement est terminée, le modèle entraîné peut être utilisé pour l’inférence. Le modèle est essentiellement un programme logiciel qui encapsule la fonction produite par le processus d’entraînement. Vous pouvez entrer un ensemble de valeurs de fonctionnalité et recevoir en tant que sortie une prédiction de l’étiquette correspondante. Étant donné que la sortie du modèle est une prédiction qui a été calculée par la fonction, et non une valeur observée, vous verrez souvent la sortie de la fonction affichée sous la forme ŷ (qui est plutôt délicieusement verbalisée comme « y-hat »).

Commentaires

Cette page a-t-elle été utile ?