Trainieren von benutzerdefinierten Modellen
Der Azure Document Intelligence-Dienst von Azure unterstützt überwachtes maschinelles Lernen. Sie können benutzerdefinierte Modelle trainieren und zusammengesetzte Modelle mit Formulardokumenten und JSON-Dokumente erstellen, die beschriftete Felder enthalten.
So trainieren Sie ein benutzerdefiniertes Modell:
- Speichern Sie Beispielformulare in einem Azure-Blobcontainer zusammen mit JSON-Dateien, die Layout- und Bezeichnungsfeldinformationen enthalten.
- Sie können eine ocr.json Datei für jedes Beispielformular generieren, indem Sie die Analyse--Funktion des Dokuments von Azure Document Intelligence verwenden. Darüber hinaus benötigen Sie eine einzelne fields.json Datei, die die felder beschreibt, die Sie extrahieren möchten, und eine labels.json Datei für jedes Beispielformular, die die Felder ihrem Speicherort in diesem Formular zuordnen.
- Generieren Sie eine SAS-URL (Shared Access Security) für den Container.
- Verwenden Sie die Buildmodell REST-API-Funktion (oder entsprechende SDK-Methode).
- Verwenden Sie die Get-Modell REST-API-Funktion (oder entsprechende SDK-Methode), um die trainierte Modell-IDabzurufen.
ODER
- Verwenden Sie Azure Document Intelligence Studio zum Bezeichnen und Trainieren. Es gibt zwei Typen zugrunde liegender Modelle für benutzerdefinierte Formulare benutzerdefinierte Vorlagenmodelle oder benutzerdefinierte neurale Modelle.
- Benutzerdefinierte Vorlagenmodelle exakt bezeichnete Schlüsselwertpaare, Auswahlmarken, Tabellen, Regionen und Signaturen aus Dokumenten extrahieren. Die Schulung dauert nur ein paar Minuten, und mehr als 100 Sprachen werden unterstützt.
- Benutzerdefinierte neurale Modelle sind tief gelernte Modelle, die Layout- und Sprachfeatures kombinieren, um beschriftete Felder aus Dokumenten präzise zu extrahieren. Dieses Modell eignet sich am besten für halbstrukturierte oder unstrukturierte Dokumente.