Inzicht in de mogelijkheden van Azure Vision-afbeeldingsanalyse
De mogelijkheden voor afbeeldingsanalyse van Azure Vision kunnen met of zonder aanpassingen worden gebruikt. Enkele van de mogelijkheden waarvoor geen aanpassing is vereist, zijn:
- Een afbeelding beschrijven met bijschriften
- Algemene objecten in een afbeelding detecteren
- Visuele kenmerken labelen
- Optische tekenherkenning
Een afbeelding beschrijven met bijschriften
Azure Vision biedt de mogelijkheid om een afbeelding te analyseren, de objecten erin te evalueren en een door mensen leesbare beschrijving van de afbeelding te genereren. Bekijk bijvoorbeeld de volgende afbeelding:
Azure Vision retourneert het volgende bijschrift voor deze afbeelding:
Een persoon die op een skateboard springt
Algemene objecten in een afbeelding detecteren
Azure Vision kan duizenden algemene objecten in afbeeldingen identificeren. Wanneer u bijvoorbeeld objecten in de skateboarder-afbeelding hebt gedetecteerd die eerder zijn besproken, retourneert Azure Vision de volgende voorspellingen:
- Skateboard (90.40%)
- Persoon (95,5%)
De voorspellingen bevatten een betrouwbaarheidsscore die aangeeft hoe zeker het model is dat wat het model beschrijft wat er daadwerkelijk in de afbeelding staat.
Naast de gedetecteerde objectlabels en de bijbehorende waarschijnlijkheden retourneert Azure Vision begrenzingsvakcoördinaten die de boven-, linker-, breedte- en hoogte van het gedetecteerde object aangeven. U kunt deze coördinaten gebruiken om te bepalen waar in de afbeelding elk object is gedetecteerd, zoals deze:
Visuele kenmerken labelen
Azure Vision kan tags voor een afbeelding voorstellen op basis van de inhoud ervan. Tags zijn gekoppeld aan afbeeldingen als metagegevens. De tags bevatten een overzicht van kenmerken van de afbeelding. U kunt tags gebruiken om een afbeelding te indexeren, samen met een set sleuteltermen voor een zoekoplossing.
De tags die worden geretourneerd voor de skateboarder-afbeelding (met bijbehorende betrouwbaarheidsscores) zijn bijvoorbeeld:
- sport (99.60%)
- persoon (99,56%)
- schoenen (98.05%)
- schaatsen (96.27%)
- boardsport (95.58%)
- skateboarding apparatuur (94.43%)
- kleding (94.02%)
- wand (93.81%)
- skateboarden (93.78%)
- skateboarder (93,25%)
- individuele sporten (92.80%)
- straat stunts (90.81%)
- saldo (90,81%)
- springen (89,87%)
- sportuitrusting (88,61%)
- extreme sport (88.35%)
- kickflip (88.18%)
- stunt (87.27%)
- skateboard (86.87%)
- stuntuitvoerder (85.83%)
- knie (85.30%)
- sport (85,24%)
- longboard (84,61%)
- longboarding (84,45%)
- rijden (73.37%)
- skate (67.27%)
- lucht (64,83%)
- jong (63.29%)
- buiten (61.39%)
Optische tekenherkenning
De Azure Vision-service kan ocr-mogelijkheden (optical character recognition) gebruiken om tekst in afbeeldingen te detecteren. Denk bijvoorbeeld aan de volgende afbeelding van een voedingslabel op een product in een supermarkt:
De Azure Vision-service kan deze afbeelding analyseren en de volgende tekst extraheren:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
Trainen van aangepaste modellen
Als de ingebouwde modellen van Azure Vision niet aan uw behoeften voldoen, kunt u de service gebruiken om een aangepast model te trainen voor afbeeldingsclassificatie of objectdetectie. Azure Vision bouwt aangepaste modellen op het vooraf getrainde basismodel, wat betekent dat u geavanceerde modellen kunt trainen met behulp van relatief weinig trainingsafbeeldingen.
Afbeeldingsclassificatie
Een afbeeldingsclassificatiemodel wordt gebruikt om de categorie of klasse van een afbeelding te voorspellen. U kunt bijvoorbeeld een model trainen om te bepalen welk type fruit wordt weergegeven in een afbeelding, zoals:
| Appel | Banaan | Oranje |
|---|---|---|
|
|
|
Objectdetectie
Objectdetectiemodellen detecteren en classificeren objecten in een afbeelding, waarbij begrenzingsvakcoördinaten worden geretourneerd om elk object te vinden. Naast de ingebouwde mogelijkheden voor objectdetectie in Azure Vision kunt u een aangepast objectdetectiemodel trainen met uw eigen afbeeldingen. U kunt bijvoorbeeld foto's van fruit gebruiken om een model te trainen dat meerdere vruchten in een afbeelding detecteert, zoals:
Opmerking
Details over het gebruik van Azure Vision voor het trainen van een aangepast model vallen buiten het bereik van deze module. U vindt informatie over aangepaste modeltrainingen in de Documentatie van Azure Vision.
Laten we nu kijken naar mogelijkheden die specifiek zijn voor de Face-service van Azure Vision.