Développer des solutions de vision par ordinateur dans Azure

La vision par ordinateur est un aspect de l’intelligence artificielle qui concerne la perception visuelle. Azure AI inclut plusieurs services qui prennent en charge les scénarios courants de vision par ordinateur.

Prérequis

Avant de commencer ce parcours d’apprentissage, vous devrez déjà :

  • Connaître Azure et le portail Azure.
  • Expérience de programmation.

Modules de ce parcours d’apprentissage

Avec le service Azure Vision, vous pouvez utiliser des modèles préentraînés pour analyser des images et extraire des insights et des informations à partir d’eux.

Le service Azure Vision Image Analysis utilise des algorithmes pour traiter des images et retourner des informations. Ce module vous explique comment utiliser l’API Analyse d’images pour la reconnaissance optique de caractères (OCR).

La capacité des applications à détecter les visages humains, à analyser les caractéristiques faciales et les émotions et à identifier les individus est une fonctionnalité d’intelligence artificielle clé.

La classification d’images est utilisée pour déterminer l’objet principal d’une image. Vous pouvez utiliser les services Azure AI Custom Vision pour effectuer l’apprentissage d’un modèle qui classifie des images en fonction de vos propres catégorisations.

La détection des objets permet de localiser et d’identifier des objets dans des images. Vous pouvez utiliser Azure AI Custom Vision pour former un modèle afin de détecter des types d’objets spécifiques dans des images.

Azure Video Indexer est un service permettant d’extraire des informations des vidéos, dont l’identification des visages, la reconnaissance de texte, les étiquettes d’objets, la segmentation des scènes, etc.

Une image vaut mille mots, et les modèles d'IA génératifs multimodaux peuvent interpréter des images pour répondre aux requêtes visuelles. Découvrez comment créer des applications de conversation compatibles avec la vision.

Dans Microsoft Foundry, vous pouvez utiliser des modèles de génération d’images pour créer des images originales basées sur des invites en langage naturel.