Delen via


Overzicht van optische tekenherkenning

Opmerking

Tot juni 2026 kunt u gratis een beperkt aantal optische tekenherkenning en andere geselecteerde inhoudsservices uitproberen als u betalen per gebruik-facturering hebt ingesteld. Zie Betalen per gebruik-services uitproberen voor informatie en beperkingen.

Met de OCR-service (Optical Character Recognition) in SharePoint kunt u gedrukte of handgeschreven tekst extraheren uit afbeeldingen en documenten. Voorbeelden van afbeeldingen zijn posters, tekeningen en productlabels. Voorbeelden van documenten zijn artikelen, rapporten, formulieren en facturen.

De tekst wordt meestal geëxtraheerd als woorden, tekstregels en alinea's of tekstblokken, zodat u toegang hebt tot de digitale versie van de gescande tekst. De geëxtraheerde informatie wordt geïndexeerd in de zoekfunctie en kan beschikbaar worden gesteld voor nalevingsfuncties, zoals preventie van gegevensverlies (DLP).

U schakelt bijvoorbeeld de OCR-service in en voegt vervolgens afbeeldingsbestanden toe aan uw documentbibliotheek. De functie scant automatisch de afbeeldingsbestanden, extraheert de relevante tekst en maakt de tekst uit de afbeeldingen beschikbaar voor zoeken en indexeren. Met deze functie kunt u snel en nauwkeurig de trefwoorden en woordgroepen vinden die u zoekt.

Vereisten en beperkingen

Deze service is alleen beschikbaar voor SharePoint-sites, waaronder hubsites, sites die zijn gekoppeld aan een hubsite en de primaire site van een siteverzameling. Subsites worden niet ondersteund.

Ondersteunde bestandstypen

Eindpunt Ondersteunde bestandstypen
SharePoint en OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf (scanned and hybrid) Ingesloten afbeeldingen in docx, pptx, xlsx worden geëxtraheerd en gescand
Exchange .jpeg, .jpg, .png, .bmp, .tiff, and PDFs (scanned and hybrid) . Ingesloten afbeeldingen in docx, pptx, xlsx, rar, tar, zip, 7z
Teams-, Windows- en macOS-eindpunt .jpeg, .jpg, .png, .bmp, .tiff, and PDF (image only)

Naast PDF op basis van afbeeldingen ondersteunt SharePoint OCR hybride PDF (tekst plus pdf-afbeelding). Zojuist geüploade hybride PDF-bestanden worden verwerkt door de OCR-service.

Opmerking

Wanneer u OCR toepast op een afbeeldingsbestand, wordt de tekst opgeslagen in de kolom Geëxtraheerde tekstmetagegevens . Wanneer u OCR toepast op een PDF- of TIFF-bestand, wordt de geëxtraheerde tekst geïndexeerd in de zoekfunctie, maar niet beschikbaar in de kolom met metagegevens.

Ondersteuning voor Office-bestanden in SharePoint

SharePoint ondersteunt nu OCR voor Microsoft 365 Office-bestanden, waaronder Word-, PowerPoint- en Excel-documenten. Alle afbeeldingen die aan deze bestanden worden toegevoegd, worden automatisch gescand met OCR en de geëxtraheerde tekst wordt geïndexeerd voor zoekdoeleinden en geïntegreerd in nalevingsoplossingen. Daarnaast heeft SharePoint ontdubbelingsprocessen geïmplementeerd om te controleren op unieke afbeeldingen om dubbele kosten voor dezelfde afbeeldingen te voorkomen.

Ondersteunde talen

De OCR-service ondersteunt meer dan 150 talen.

Ondersteunde locaties en oplossingen

De OCR-service ondersteunt meerdere oplossingen, zoals wordt weergegeven in de volgende tabel. Zie Ondersteunde locaties en oplossingen in Microsoft Purview voor meer informatie over nalevingsoplossingen.

Locatie Ondersteunde oplossing
Exchange Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers.
Tekst is beschikbaar voor nalevingsoplossingen.
SharePoint-sites Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers.
Tekst is beschikbaar voor nalevingsoplossingen.
OneDrive-accounts Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers.
Tekst is beschikbaar voor nalevingsoplossingen.
Chat- en kanaalbericht van Teams Tekst is beschikbaar voor nalevingsoplossingen.
Apparaten Tekst is beschikbaar voor nalevingsoplossingen.

Bestandbeperkingen

  • Afbeeldingen moeten kleiner zijn dan 50 MB.

  • Afbeeldingen moeten ten minste 50 x 50 pixels en niet groter zijn dan 16.000 x 16.000 pixels.

  • Afbeeldingen die zijn geüpload nadat OCR is ingeschakeld, zijn de enige afbeeldingen die worden gescand.