Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Der Dokumentenverarbeitungs-Agent ist ein autonomer Agent in Copilot Studio, der generative KI zum Verarbeiten von Dokumenten verwendet.
Tipp
Der verwaltete Agent Dokumentenverarbeiter ist eine Paketlösung für die End-to-End-Dokumentenverarbeitung. Es übernimmt die Extraktion, Validierung, menschliche Überwachung und den Export in nachgelagerte Apps. Dieser Artikel zeigt die Referenzarchitektur für die Verwendung eines autonomen Agenten in Copilot Studio zur Verarbeitung von Dokumenten. Sie können das Architekturbeispiel für verschiedene Szenarien und Branchen anpassen.
Architekturdiagramm
Agentenanweisungen
Mit den folgenden Anweisungen wird der autonome Agent erstellt:
You are a helpful, polite, document processing agent. You help users process documents and extract valuable information.
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.
Workflows
Es gibt zwei wichtige Workflows im Zusammenhang mit dem Agenten:
- Dokumentenverarbeitung: In diesem Workflow wird erläutert, wie der Agent Dokumente verarbeitet.
- Konfiguration: Dieser Workflow beschreibt die Schritte zum Einrichten des Agenten für die autonome Dokumentenverarbeitung.
Dokumentenverarbeitungsflow
Der Dokumentenverarbeitungsablauf funktioniert wie ein Zustandsautomat. Der Agent fungiert als Orchestrator. Der aktuelle Status wird in der Tabelle „Datenverarbeitungsereignisse“ in Dataverse gespeichert. So funktioniert der Prozess:
Ein Trigger identifiziert, wann ein neues Dokument zur Verarbeitung bereit ist. Dies wird im Bereich Datenquellen im Architekturdiagramm angezeigt. Agentenflows durchsuchen Verzeichnisse wie Outlook-Postfächer oder SharePoint-Ordner. Wenn ein Dokument irgendeinem Verzeichnis hinzugefügt wird, speichert der Agentenflow es in der Tabelle „Datenverarbeitungsereignisse“ mit dem Status „Neu“ und sendet eine Nachricht an den Agenten:
Process the document: {ID}.- Alle Versuche, Dokumente hinzuzufügen oder den Status in der Tabelle „Datenverarbeitungsereignisse“ zu aktualisieren, folgen der
Default-Konfiguration in Power Automate. Der Flow wird bis zu viermal mit einem exponenziellen Intervall für Anforderungen wiederholt, die den Status 408, 429 oder 5xx zurückgeben, sowie für alle Konnektivitätsausnahmen. - Wenn alle Wiederholungsversuche fehlschlagen, debuggen und überprüfen Sie den Ausführungsverlauf in Power Automate für die Aktion, die nicht ausgeführt werden konnte.
- Alle Versuche, Dokumente hinzuzufügen oder den Status in der Tabelle „Datenverarbeitungsereignisse“ zu aktualisieren, folgen der
Die Anweisungen des Agenten weisen ihn an, die
Document Extraction-Aktion aufzurufen, wenn er aufgefordert wird, ein Dokument zu verarbeiten. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der
Document Extraction-Aktion handelt es sich um einen Agentenflow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- Dafür sorgt, dass das Dokument in Dataverse gespeichert wird.
- Es an einen KI-Prompt in AI Builder zur Verarbeitung sendet. Dieser Prompt verwendet GPT 4.o für Folgendes:
- Extrahieren Sie alle relevanten Informationen aus dem Dokument.
- Formatieren Sie diese Informationen als JSON-Dokument.
- Speichert die extrahierten Informationen in derselben Datenverarbeitungsereigniszeile.
- Aktualisieren des Status des Dokuments auf
Processed.
Ein Dataverse-Trigger (Agentenflow) überwacht den Status aller Dokumente in den Datenverarbeitungsereignissen und benachrichtigt den Agenten, wenn sich ein Status ändert mit der folgenden Nachricht:
The status of document {ID} changed to {Status}Die Anweisungen des Agenten weisen ihn an, die
Document Validation-Aktion aufzurufen, wenn sich der Status des Dokuments auf Verarbeitet ändert. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der
Document Validation-Aktion handelt es sich um einen Agentenflow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- Die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- Es an einen KI-Prompt in AI Builder zur Validierung sendet. Dieser Prompt verwendet GPT 4.o für Folgendes:
- Überprüfung des extrahierten JSONs anhand von Formatregeln wie
dates must be in X format. - Überprüfung des extrahierten JSONs anhand von Geschäftsregeln wie
the author of the document must be in the Accounts table in Dataverse.
- Überprüfung des extrahierten JSONs anhand von Formatregeln wie
- Wenn die Validierung erfolgreich ist, wird der Status des Dokuments auf
Validatedaktualisiert. - Andernfalls wird der Status des Dokuments auf
Manual Reviewaktualisiert.
Wenn sich der Status des Dokuments auf
Validatedändert, ruft der Agent gemäß seiner Anweisungen dieDocument Export-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der Aktion „Dokumentexport“ handelt es sich um einen Agentenfluss, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:
- Die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- Exportiert diese Daten in das Zielsystem, z. B. in die Tabelle „Rechnungen“ in Dataverse.
Wenn sich der Status des Dokuments auf
Manual Reviewändert, ruft der Agent gemäß seiner Anweisungen dieManual Review-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der
Manual Review-Aktion handelt es sich um einen Agentenflow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- Die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- Erstellt eine Genehmigungsanforderung für die Fachkraft für die Agentenadministration und gibt eine Verknüpfung zu einer Prüfungsstations-App frei, wo der Benutzende extrahierte Daten bearbeiten und manuell prüfen kann. Diese manuelle Prüfung legt den Status des Dokuments auf
Validatedfest.
Wenn der Status des Dokuments nach der manuellen Überprüfung
Validatedlautet, wird Schritt 7 ausgeführt.
Benutzende können Dokumente auch manuell über die Chatseite in Copilot Studio oder einen beliebigen Kanal, in dem sie den Agent veröffentlicht haben, zur Verarbeitung an den Agenten übermitteln.
Beachten Sie in diesem Fall Folgendes:
- Das Dokument wird in die Tabelle „Datenverarbeitungsereignisse“ hochgeladen.
- Der Agent benachrichtigt sich selbst, dass ein neues Dokument importiert wurde.
- Die Eingabeaufforderung zum Extrahieren wird ausgeführt, um Ihnen eine Vorschau dessen zu geben, was im Chatbereich exportiert wird.
- Das Dokument wird wie in diesem Ablauf ab Schritt 2 beschrieben verarbeitet.
Konfigurationsworkflow
Der Agent benötigt mehrere Konfigurationen, um autonom zu arbeiten. Um dies zu vereinfachen, gibt es eine umfassende Konfigurationsoberfläche. Gehen Sie folgendermaßen vor:
- Installieren Sie den Dokumentenverarbeitungsagenten in Copilot Studio. Die Agentenlösung verfügt über Folgendes:
- Eine Konfigurationstabelle für die Dokumentenverarbeitung.
- Eine Validierungsstation Canvas-App für die Überwachung.
- Vom Agenten verwendete Verbindungsreferenzen (Dataverse, Copilot Studio, PowerApps for Admins).
- Von den Triggern, die den Agentenworkflow starten, verwendete Verbindungsreferenzen (Outlook, SharePoint).
- Von den Triggern verwendete Umgebungsvariablen.
- Starten Sie den Agentenkonfigurations-Assistenten. Dies ist der letzte Schritt des Installationsassistenten in Copilot Studio. Er leitet Sie durch diesen Flow:
- Laden Sie ein Beispieldokument hoch.
- Das System sendet das hochgeladene Dokument an die Extraktionsaufforderung des Agenten.
- Der extrahierte Inhalt und der Dokumenttyp werden angezeigt. Wählen Sie aus, welche Teile der extrahierten Daten Sie in das System exportieren möchten. Dadurch wird ein Schema erstellt, das in der Konfigurationstabelle für die Dokumentverarbeitung gespeichert und während der Dokumentexportaktion verwendet wird. Sie können in den erweiterten Modus wechseln, um die in der Dokumentextraktionsaktion verwendete KI-Eingabeaufforderung zu ändern und anzupassen.
- Definieren Sie Validierungsregeln über eine einfache Benutzeroberfläche, die der in der Dokumentvalidierungsaktion verwendeten Eingabeaufforderung Regeln hinzufügt. Sie können auch in den erweiterten Modus wechseln, um die KI-Eingabeaufforderung direkt zu ändern.
- Geben Sie die E-Mail-Adresse des Agent-Administrators ein, wenn Sie dazu aufgefordert werden. Dies wird in der manuellen Überprüfungsaktion beim Erstellen der Genehmigungsanforderung verwendet. Sie können auch eine benutzerdefinierte Nachricht für die genehmigende Person hinzufügen. Diese Informationen werden in den Umgebungsvariablen gespeichert, die im Lieferumfang der Lösung enthalten sind.
- Wählen Sie eine Dokumentquelle aus einer Liste aus. Diese Trigger starten den Dokumentverarbeitungsfluss und benötigen in der Regel eine Verbindungsreferenz und einige Umgebungsvariablen (z. B. Postfachname oder Ordneradresse), je nach ausgewählter Dokumentquelle.
- Beenden Sie die Konfiguration. Dadurch wird im System eine Dataverse-Tabelle mit den zuvor ausgewählten Spalten angelegt und das Dokument, das Sie im Assistenten verwendet haben, wird in diese Tabelle exportiert.
Komponenten
Hier sind die Schlüsselkomponenten, die an der Erstellung und Bereitstellung eines autonomen Agenten für die Dokumentenverarbeitung in Copilot Studio beteiligt sind.
- Copilot Studio gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Copilot Studio ist ein grafisches Low-Code-Tool zum Erstellen eines Agenten – dazu gehört auch das Erstellen einer Automatisierung mit Agentenflows – und zum Erweitern eines Microsoft 365 Copilot mit Ihren Unternehmensdaten und -szenarien.
- Power Apps gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Power Apps ist eine Suite aus Apps, Diensten, Connectors und einer Datenplattform, mit der Sie eine schnelle Umgebung für die Entwicklung erhalten, um benutzerdefiniert Apps für Ihr Unternehmen zu erstellen. Mit Power Apps können Sie rasch benutzerdefinierte Geschäftsanwendungen erstellen, die eine Verbindung zu Ihren Geschäftsdaten in der zugrunde liegenden Datenplattform (Microsoft Dataverse) oder in zahlreichen Online- und lokalen Datenquellen, wie SharePoint, Microsoft 365, Dynamics 365 und SQL Server, herstellt.
- Dataverse ist eine Betriebsdatenbank für Szenarien mit mehreren Agenten. Es bietet Agenten eine sichere, skalierbare Plattform zum Speichern von Statusdaten, Verlauf und Konversationsdaten. Dieser zentralisierte Speicher ermöglicht es Agenten, zu interagieren und Daten auszutauschen, sodass sie Aufgaben autonom oder halbautonom ausführen können. Dataverse ermöglicht es Agenten außerdem, sich mit Geschäftsdaten in verschiedenen Geschäftsanwendungen wie CRM-Systemen zu verbinden und diese zu aktualisieren, sodass die Daten im gesamten Unternehmen konsistent und aktuell bleiben. Mit Dataverse erreichen Organisationen bei der Verwaltung und Steuerung von Agentenworkflows Zuverlässigkeit, Sicherheit und erstklassigen Betriebsprozessen.
Einzelheiten zum Szenario
Organisationen arbeiten mit strukturierten Dokumenten wie Formularen, Rechnungen, Quittungen und Ausweisdokumenten sowie mit unstrukturierten Dokumenten wie Memos, Verträgen und Kundenfeedbackanfragen. Eine zentrale Herausforderung für Unternehmen ist die Automatisierung der Dokumentenverarbeitung zur Optimierung von Geschäftsprozessen. Sie können mehrere Schritte automatisieren, einschließlich der Dokumenterfassung, Klassifizierung, Extraktion, Validierung, Transformation und des Exports. Die Verwendung eines Dokumentenverarbeitungsagenten bietet viele Vorteile gegenüber der herkömmlichen Dokumentenverarbeitung. Der Document Processing Agent funktioniert sofort als Paketlösung, sodass Sie während der Einrichtung keine zeitaufwändige Datenbeschriftung vornehmen müssen. Dank des interaktiven Designs können Sie große Mengen an Dokumenten unter menschlicher Aufsicht verarbeiten.
Überlegungen
Diese Überlegungen implementieren die Säulen von Power Platform Well-Architected, eine Reihe von Leitprinzipien, welche die Qualität einer Workload verbessern. Weitere Informationen finden Sie unter Microsoft Power Platform Well-Architected.
Zuverlässigkeit
Der Dokumentenverarbeitungsagent ist auf Ausfallsicherheit, Wiederherstellung und Vorgänge unter Verwendung von Power Platform-Komponenten ausgelegt, die in Azure gehostet werden.
Sicherheit
Der Dokumentenverarbeitungsagent wurde entwickelt, um die Vertraulichkeit, Integrität und Datenverfügbarkeit zu schützen, indem er in Azure gehostete Power Platform-Komponenten verwendet. Dokumente, die in die Tabelle „Datenverarbeitungsereignisse“ importiert wurden, sind nur für Systemadministratoren sichtbar. Es werden keine zusätzlichen Daten, außer angehängten Dokumenten, wie E-Mail-Text oder -Betreff, in Dataverse gespeichert. Alle kundenbezogenen Informationen, die einem Dokument zugeordnet sind, werden in der Spalte „Verarbeitete Daten“ der Tabelle „Datenverarbeitungsereignisse“ gespeichert. Sie können DSGVO-Anforderungen bearbeiten, indem Sie diese Spalte abfragen.
Betriebliche Effizienz
Der Dokumentenverarbeitungsagent wurde entwickelt, um Vorgänge durch Überwachung und Erkenntnisse zu verbessern und mithilfe von Power Platform-Komponenten, die in Azure gehostet werden, Effizienz durch Automatisierung zu erreichen.
Leistungsfähigkeit
Der Dokumentenverarbeitungsagent ist darauf ausgelegt, Leistung durch Optimierung zu erreichen, indem er Power Platform-Komponenten verwendet, die in Azure gehostet werden. Der Dokumentenverarbeitungsagent unterstützt die Verarbeitung von Dokumenten mit einer Größe von bis zu 20 MB. Nach dem neuesten Benchmark dauert es etwa 48 Sekunden, um ein einzelnes Dokument mit einer Größe von 2 MB zu verarbeiten. Der Agent ist so konzipiert, dass er diese Verarbeitungsdauer für mehr als 1.000 Dokumente aufrechterhalten kann, vorausgesetzt, die ausgewählte Dokumentquelle verfügt über ausreichend Speicherplatz. Weitere Kontingente und Einschränkungen finden Sie unter Grenzwerte – Power Automate.
Umgebungsoptimierung
Der Dokumentenverarbeitungsagent wurde für Benutzende in der Dokumentenverarbeitung entwickelt, um durch die Verwendung von Power Platform-Komponenten Einfachheit und Effizienz zu erreichen. Der Agent bietet konfigurierbare Funktionen zum Hinzufügen von Dokumentquellen und ermöglicht die Erweiterbarkeit zum Hinzufügen zusätzlicher Dokumentquellen.
Verantwortungsvolle KI
Der Dokumentenverarbeitungsagent wurde entwickelt, um verantwortungsvolle KI-Standards umzusetzen, indem er Power Platform-Komponenten wie Copilot Studio verwendet, das für generative KI-Funktionen entwickelt wurden. Weitere Informationen: Häufig gestellte Fragen zur verantwortungsvollen KI für Copilot Studio.
Mitwirkende
Dieser Artikel wird von Microsoft gepflegt. Die folgenden Mitwirkenden haben diesen Artikel geschrieben.
Hauptautoren:
- Jaganmohan Naidu Penikalapati, Leitender Manager für Softwareentwicklung
- Ceren Kiroglu, Senior Product Manager
- Durga Yelavarthi, Hauptarchitekt
- Jo Ruas, SoftwareTechniker
Zugehörige Ressourcen
- Verwalteten Agent von Microsoft installieren
- Agenten im Einsatz: Dokumentenverarbeitung 2.0
- So arbeiten Agent-Unterhaltungen
Nächste Schritte,
- Verbessern Sie den Konfigurationsablauf, damit Benutzer ihre Exporterfahrung anpassen können. Fügen Sie beispielsweise vordefinierte Power Platform-Connectors für den Export in Systeme wie SAP oder Salesforce hinzu und ermöglichen Sie Benutzenden, das Schema an SAP- oder Salesforce-Tabelleneinträge anzupassen.
- Verbessern Sie den Konfigurationsflow, damit Benutzende eine Verbindung zu mehreren Dokumentquellen, z. B. Outlook und SharePoint, gleichzeitig herstellen können.
- Lassen Sie den Agenten mehrere Dokumenttypen gleichzeitig bearbeiten, indem Sie das beim Exportieren verwendete Schema basierend auf dem Dokumenttyp dynamisch ändern.