Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Waarschuwing
We raden u niet aan deze service te gebruiken, waaronder de Azure Vision in Foundry Tools legacy OCR API v3.2 en RecognizeText API v2.1.
OCR-versies (Lezen)
Belangrijk
Selecteer de Read-editie die het beste past bij uw vereisten.
| Invoer | Voorbeelden | Lees de editie | Voordeel |
|---|---|---|---|
| Afbeeldingen: Algemeen, in het wild afbeeldingen | labels, straatborden en posters | OCR voor afbeeldingen (versie 4.0) | Geoptimaliseerd voor algemene, niet-documentafbeeldingen met een synchrone API met verbeterde prestaties, waardoor ocr eenvoudiger kan worden ingesloten in uw gebruikerservaringsscenario's. |
| Documenten: Digitaal en gescand, inclusief afbeeldingen | boeken, artikelen en rapporten | Document Intelligence-leesmodel | Geoptimaliseerd voor tekstzware gescande en digitale documenten met een asynchrone API om intelligente documentverwerking op schaal te automatiseren. |
Lees over de algemene beschikbaarheid van Azure Vision v3.2
Bent u op zoek naar de meest recente Azure Vision v3.2 GA Read-functie? Alle toekomstige verbeteringen voor lees-OCR maken deel uit van de twee services die eerder zijn vermeld. Er zijn geen verdere updates voor Azure Vision v3.2. Zie voor meer informatie Call Azure Vision 3.2 GA Read API en Quickstart: Azure Vision v3.2 GA Read.
OCR of Optical Character Recognition wordt ook wel tekstherkenning of tekstextractie genoemd. Met OCR-technieken op basis van machine learning kunt u gedrukte of handgeschreven tekst extraheren uit afbeeldingen, zoals posters, straatborden en productlabels, evenals documenten zoals artikelen, rapporten, formulieren en facturen. De tekst wordt meestal geëxtraheerd als woorden, tekstregels en alinea's of tekstblokken, waardoor de toegang tot de digitale versie van de gescande tekst mogelijk is. Deze mogelijkheid elimineert of vermindert de noodzaak van handmatige gegevensinvoer.
OCR-motor
De Lees-OCR-engine van Microsoft maakt gebruik van meerdere geavanceerde machine learning-modellen die wereldwijde talen ondersteunen. Het extraheert gedrukte en handgeschreven tekst, waaronder gemengde talen en schrijfstijlen. U kunt Lezen als een cloudservice of als een on-premises container gebruiken voor flexibele implementatie. Het is ook beschikbaar als een synchrone API voor enkele scenario's zonder document, alleen afbeeldingen met prestatieverbeteringen die het implementeren van ocr-ondersteunde gebruikerservaringen vereenvoudigen.
Hoe is OCR gerelateerd aan Intelligent Document Processing (IDP)?
Intelligent Document Processing (IDP) maakt gebruik van OCR als basistechnologie om structuur, relaties, sleutelwaarden, entiteiten en andere documentgerichte inzichten te extraheren met een geavanceerde AI-service op basis van machine learning, zoals Document Intelligence. Document Intelligence bevat een voor documenten geoptimaliseerde versie van Read als OCR-engine, terwijl het voor geavanceerdere inzichten gebruikmaakt van andere modellen. Als u tekst uit gescande en digitale documenten extraheert, gebruikt u Document Intelligence Read OCR.
OCR gebruiken
Probeer OCR uit met behulp van Vision Studio. Volg vervolgens een van de koppelingen naar de Read-editie die het beste voldoet aan uw vereisten.
Ondersteunde OCR-talen
Beide leesversies die momenteel beschikbaar zijn in Azure Vision ondersteunen verschillende talen voor afgedrukte en handgeschreven tekst. OCR voor afgedrukte tekst ondersteunt Engels, Frans, Duits, Italiaans, Portugees, Spaans, Chinees, Japans, Koreaans, Russisch, Arabisch, Hindi en andere internationale talen die gebruikmaken van Latijnse, Cyrillische, Arabische en Devanagari-scripts. OCR voor handgeschreven tekst ondersteunt Engels, Vereenvoudigd Chinees, Frans, Duits, Italiaans, Japans, Koreaans, Portugees en Spaans.
Raadpleeg de volledige lijst met talen die door OCR worden ondersteund.
Algemene OCR-functies
Het READ OCR-model is beschikbaar in Azure Vision en Document Intelligence met algemene basislijnmogelijkheden en optimaliseert voor de respectieve scenario's. De volgende lijst bevat een overzicht van de algemene functies:
- Gedrukte en handgeschreven tekstextractie in ondersteunde talen
- Pagina's, tekstregels en woorden met locatie- en betrouwbaarheidsscores
- Ondersteuning voor gemengde talen, gemengde modus (afdrukken en handgeschreven)
- Beschikbaar als Distroless Docker-container voor on-premises implementatie
De OCR-cloud-API's gebruiken of on-premises implementeren
De meeste klanten geven de voorkeur aan cloud-API's, omdat ze eenvoudig kunnen worden geïntegreerd en snelle productiviteit bieden. Azure en de Azure Vision-service verwerken schaal-, prestatie-, gegevensbeveiligings- en nalevingsbehoeften terwijl u zich richt op het voldoen aan de behoeften van uw klanten.
Voor on-premises implementatie kunt u met de Read Docker-container de algemeen beschikbare OCR-mogelijkheden van Azure Vision v3.2 implementeren in uw eigen lokale omgeving. Containers zijn ideaal voor specifieke vereisten voor beveiliging en gegevensbeheer.
Vereisten voor invoer
De Read-API gebruikt afbeeldingen en documenten als invoer. De afbeeldingen en documenten moeten voldoen aan de volgende vereisten:
- Ondersteunde bestandsindelingen zijn JPEG, PNG, BMP, PDF en TIFF.
- Voor PDF- en TIFF-bestanden worden maximaal 2000 pagina's verwerkt (alleen de eerste twee pagina's voor de gratis laag).
- De bestandsgrootte van afbeeldingen moet kleiner zijn dan 500 MB (4 MB voor de gratis laag) met afmetingen van ten minste 50 x 50 pixels en maximaal 10.000 x 10.000 pixels. PDF-bestanden hebben geen groottelimiet.
- De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768, die overeenkomt met ongeveer 8-punts lettertypetekst bij 150 DPI.
Notitie
U hoeft geen afbeelding bij te snijden voor tekstregels. Verzend de hele afbeelding naar de Read-API en herkent alle teksten.
OCR-gegevensprivacy en -beveiliging
Net als bij alle Foundry Tools moeten ontwikkelaars die de Azure Vision-service gebruiken, rekening houden met het beleid van Microsoft voor klantgegevens. Zie de pagina Foundry Tools in het Microsoft Trust Center voor meer informatie.
Volgende stappen
- Voor OCR met algemene (niet-document) afbeeldingen, probeer de quickstart voor de Azure Vision 4.0 preview Image Analysis REST API.
- Voor OCR met PDF-, Office- en HTML-documenten, evenals documentafbeeldingen, begint u met Document Intelligence Lezen.
- Voor de vorige GA-versie raadpleegt u de quickstarts voor de Azure Vision 3.2 GA SDK of REST API.