Delen via


Overzicht van ongestructureerde documentverwerking

Opmerking

Tot juni 2026 kunt u gratis een beperkte hoeveelheid ongestructureerde documentverwerking en andere geselecteerde inhoudsservices uitproberen als u betalen per gebruik-facturering hebt ingesteld. Zie Betalen per gebruik-services uitproberen voor informatie en beperkingen.

Gebruik het niet-gestructureerde documentverwerkingsmodel (lesmethode) om bestanden automatisch te classificeren en informatie te extraheren. Het werkt het beste voor ongestructureerde documenten, zoals brieven of contracten.

Opmerking

Microsoft respecteert de privacy en het eigendom van gegevens die u gebruikt om modellen te trainen en te verwerken. Geen van de gegevens van uw organisatie wordt door Microsoft gebruikt of overgedragen om AI-modellen, grote taalmodellen of andere modellen te trainen. Uw gegevens blijven veilig binnen de tenant van uw organisatie. Zie Gegevensbescherming en privacy van Microsoft voor meer informatie.

Inleiding tot ongestructureerde modellen

Niet-gestructureerde documentverwerkingsmodellen maken gebruik van kunstmatige intelligentie (AI) om informatie uit documenten te analyseren en te extraheren. Deze modellen zijn afhankelijk van identificeerbare tekst op basis van woordgroepen of patronen om zowel de classificatie van het document als de te extraheren gegevens te bepalen.

U maakt en beheert ongestructureerde documentverwerkingsmodellen in een SharePoint-inhoudscentrum. Wanneer u een model toepast op een SharePoint-documentbibliotheek, is dit gekoppeld aan een inhoudstype dat kolommen bevat voor het opslaan van geëxtraheerde informatie. U kunt een nieuw inhoudstype maken of een bestaand inhoudstype gebruiken uit de sharePoint-galerie met inhoudstypen.

Opmerking

Alleen-lezen of verzegelde inhoudstypen kunnen niet worden bijgewerkt, dus ze kunnen niet worden gebruikt in een model.

Voeg classificaties en extractoren toe aan uw ongestructureerde documentverwerkingsmodellen om de volgende acties uit te voeren:

  • Classificaties worden gebruikt om documenten die worden geüpload naar de documentbibliotheek te identificeren en classificeren. Een classificatie kan bijvoorbeeld worden ‘getraind’ om alle documenten met contractverlengingen te identificeren die naar de bibliotheek worden geüpload. Het inhoudstype contractverlenging wordt door u gedefinieerd wanneer u de classificatie maakt.

  • Extractoren halen informatie uit deze documenten. Voor elk contractverlengingsdocument dat in uw documentbibliotheek wordt geïdentificeerd, worden bijvoorbeeld kolommen weergegeven met de begindatum van de service en de client voor elk document.

Gebruik voorbeeldbestanden om uw classificaties en extractoren te trainen en te testen. Met deze bestanden leert het model waar u op moet letten bij het identificeren en extraheren van gegevens. Train bijvoorbeeld uw contractverlengingsmodel met behulp van echte contractverlengingsdocumenten van uw organisatie. U kunt deze bestanden ook gebruiken om de nauwkeurigheid van uw model te valideren.

Nadat u uw model hebt gepubliceerd, gebruikt u het inhoudscentrum om het toe te passen op een SharePoint-documentbibliotheek waartoe u toegang hebt.

Vereisten en beperkingen

Zie de vereisten en beperkingen voor de verwerking van ongestructureerde documenten voor meer informatie over vereisten die u moet overwegen bij het kiezen van dit model.