Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Content Understanding biedt geavanceerde mogelijkheden voor documentanalyse. Organisaties kunnen deze mogelijkheden gebruiken om ongestructureerde inhoud te converteren naar bruikbare en georganiseerde gegevens. Content Understanding kan aanpasbare analyses gebruiken om op deskundige wijze essentiële informatie, velden en relaties te extraheren uit een breed scala aan documenten en formulieren.
Zakelijke use-cases
Documentanalyses kunnen complexe documenten verwerken in verschillende indelingen en sjablonen:
- Levenscyclusbeheer van contracten: Sleutelvelden, componenten en verplichtingen extraheren uit verschillende contracttypen.
- Lenings- en hypotheekaanvragen: Automatiseer de verwerking om snellere verwerking mogelijk te maken door banken, kredietverleners en overheidsinstellingen.
- Financiële dienstverlening: Analyseer complexe documenten, zoals financiële rapporten en assetbeheerrapporten.
- Onkostenbeheer: Parseer ontvangstbewijzen en facturen van verschillende detailhandelaren om uitgaven in verschillende indelingen en sjablonen te valideren.
- Documentsets en kennisbankscenario's: Sleutelvelden uit documentsets als geheel extraheren. Voeg referentiegegevens toe waarmee taken, zoals validatie en verrijking, worden verwerkt door multistep-redenering toe te passen.
Belangrijkste voordelen
Content Understanding biedt krachtige mogelijkheden voor documentanalyse die zijn ontworpen om kritieke bedrijfs- en bedrijfsscenario's aan te pakken, zoals RAG en automatisering van geautomatiseerde processen. De belangrijkste voordelen zijn:
- Intelligente zoekfunctie: Transformeer ongestructureerde documenten in gestructureerde, doorzoekbare gegevensassets om de zichtbaarheid en toegankelijkheid van informatie in uw organisatie te verbeteren.
- Geaarde gegevensextractie: Behoud duidelijke traceerbaarheid en lokalisatie van geëxtraheerde gegevens om efficiënte beoordelingsprocessen met menselijke tussenkomst te vergemakkelijken en transparantie en conformiteit te garanderen.
- Automatisering op basis van betrouwbaarheid: Gebruik ingebouwde betrouwbaarheidsscores om documentverwerkingstaken intelligent te automatiseren om resourcetoewijzing te optimaliseren, operationele kosten te verlagen en de nauwkeurigheid van beslissingen te verbeteren.
- Flexibele aanpassing: Pas documentanalyses eenvoudig aan en pas deze aan zodat deze in overeenstemming zijn met specifieke bedrijfsprocessen en werkstromen. Aanpassing maakt nauwkeurige extractie en classificatie mogelijk die is afgestemd op de specifieke vereisten van uw organisatie.
- Verbeterde nauwkeurigheid en betrouwbaarheid: Bereik nauwkeurige extractie en classificatie van kritieke bedrijfsgegevens om fouten te verminderen en operationele efficiëntie in geautomatiseerde werkstromen te verbeteren.
-
Agents gereed: Verwerk uw diverse invoer en lever uitvoer in een standaardindeling die gereed is voor de werkstroom van een agent. Uitvoer kan uw toepassing inzicht geven in de intentie van de gebruiker, met gegevens die worden ondersteund door een
strongly-typedschema, waardoor het gemakkelijker is om snel gegevens op te halen in een indeling die gereed is voor uw code.
Mogelijkheden voor documentanalyse
Inhoudsextractie
Inhoudsextractie vormt de basis van de mogelijkheden voor documentanalyse van Content Understanding. Met dit proces worden ongestructureerde documenten getransformeerd in gestructureerde, machineleesbare gegevens. Met inhoudsextractie worden gedrukte en handgeschreven tekst nauwkeurig vastgelegd, terwijl de structuur van het document behouden blijft door middel van geavanceerde indelingsanalyse:
- Inhoudsanalyse
- Tekst: verwerkt meertalige inhoud, inclusief computergedrukte en handgeschreven tekst uit honderden talen.
- Selectiemarkeringen: Hiermee worden selectie-indicatoren geïdentificeerd en geëxtraheerd, zoals selectievakjes, knoppen en vergelijkbare markeringen.
- Streepjescodedetectie: scant en ontsleutelt informatie van meer dan tien typen lineaire en tweedimensionale streepjescodes.
- Wiskundige formules: legt complexe wiskundige expressies vast en behoudt deze in LaTeX-indeling.
- Afbeeldingselementen: zoekt en extraheert afbeeldingen, afbeeldingen, diagrammen en grafieken, samen met de bijbehorende bijschriften en aantekeningen.
- Hyperlinkelementen: Detecteert hyperlinks die zijn ingesloten in het document.
- Aantekeningselementen: hiermee koppelt u de inhoud aan de aantekeningen, zoals doorhalen, onderstrepen en markeren.
- Afbeeldingselementen: Detecteert en extraheert afbeeldingselementen in gestructureerde uitvoer.
- Structuuranalyse
- Alinea's: Detecteert en categoriseert tekstsegmenten op basis van hun documentcontext en -rol.
- Tabelgegevens: tabelstructuren worden herkend en geëxtraheerd, inclusief complexe indelingen met cellen en indelingen met meerdere pagina's.
- Hiërarchische secties: Brengt de organisatie van inhoud in kaart via sectiekoppen en geneste relaties tussen inhoud.
- Generatie met retrieval-augmented (RAG)
- RAG-oplossingen: Inhoudextractie vormt de basis van effectieve RAG-systemen door onbewerkte multimodale gegevens te transformeren in gestructureerde, doorzoekbare indelingen die zijn geoptimaliseerd voor ophalen. Voor meer informatie over het bouwen van RAG-oplossingen raadpleegt u Retrieval-augmented generation.
Veldextractie
Met veldextractie kunt u gestructureerde gegevens extraheren, classificeren en genereren uit verschillende documenten en formulieren die zijn aangepast om aan uw vereisten te voldoen. Het proces van het transformeren van ongestructureerde inhoud naar georganiseerde, bruikbare informatie vereenvoudigt het gegevensbeheer, verbetert de doorzoekbaarheid en ondersteunt geautomatiseerde werkstromen.
U kunt bijvoorbeeld naadloos klantgegevens, factureringsadressen en opgegeven kosten extraheren uit facturen. U kunt ook contractuele partijen, verlengingsdatums en betalingsvoorwaarden in juridische overeenkomsten identificeren. Om de efficiëntie te maximaliseren, kunt u vooraf samengestelde analysesjablonen gebruiken, zoals sjablonen die zijn afgestemd op facturen. U kunt ook helemaal zelf op maat gemaakte analyses ontwerpen om de precisie te verbeteren door het labelen van meer voorbeelddocumenten.
De betrouwbaarheids- en grounding-API is een opt-in-functie. Als u wilt kiezen voor betrouwbaarheid en aarding voor veldextractie, stelt u estimateFieldSourceAndConfidence = true in de analyseconfiguratie of estimateSourceAndConfidence = true voor een specifiek veld in.
Methoden voor veldextractie
Content Understanding biedt veelzijdige methoden voor veldextractie, waarmee nauwkeurige en op maat gemaakte verwerking van documentinhoud mogelijk is:
- Extraheren: Specifieke gegevens extraheren, zoals transactiedatums uit ontvangstbewijzen of regelitems van facturen, voor nauwkeurige en gerichte gegevensopname.
- Classificeren: Categoriseer documentinhoud in vooraf gedefinieerde categorieën, zoals het classificeren van sentiment in transcripties van gesprekken van klanten of het classificeren van hotelbevestigingsitems.
- Genereren: Maak nieuwe inzichten of samenvattingen van uw documenten, inclusief documentoverzichten en hoofdstukoverzichten om de toegankelijkheid en begrip van inhoud te verbeteren.
Vereisten voor invoer
Zie Servicequota en limieten voor meer informatie over ondersteunde indelingen voor invoerdocument.
Ondersteunde talen en regio's
Zie Taal- en regioondersteuning voor een lijst met ondersteunde talen en regio's.
Gegevens, privacy en beveiliging
Ontwikkelaars die Content Understanding gebruiken, moeten het Microsoft-beleid over klantgegevens controleren. Zie Gegevens, privacy en beveiliging voor meer informatie.
Verwante inhoud
- Probeer uw documentinhoud te verwerken met behulp van Content Understanding Studio.
- Bekijk de quickstart voor Content Understanding Studio.
- Meer informatie over het analyseren van documentinhoud met behulp van analysesjablonen.
- Bekijk codevoorbeelden met het zoeken naar visuele documenten.