Résumé

Effectué

Note

Pour plus d’informations, consultez l’onglet Texte et images !

La vision par ordinateur repose sur l’analyse et la manipulation des valeurs de pixels numériques dans les images. Les modèles Machine Learning sont entraînés à l’aide d’un grand volume d’images pour permettre des scénarios de vision par ordinateur courants, tels que la classification d’images, la détection d’objets, la segmentation sémantique, la génération de légendes et d’autres.

Les modèles utilisés pour les tâches de vision par ordinateur ont évolué de classifieurs d’images basés sur des statistiques par le biais de réseaux neuronaux convolutionnels aux modèles modals basés sur le transformateur d’aujourd’hui. Les modèles de pointe peuvent non seulement interpréter l’entrée visuelle, mais également générer une sortie visuelle.