Freigeben über


ID-Dokumentmodell von Dokument Intelligenz

Dieser Inhalt gilt für:HäkchenVersion 4.0 (GA) | Vorherige Versionen:Blaues HäkchenVersion 3.1 (GA)Blaues HäkchenVersion 3.0 (GA)Blaues HäkchenVersion 2.1 (GA)

#::: moniker-end

Dieser Inhalt gilt für:HäkchenVersion 3.1 (GA) | Aktuelle Version:Lila HäkchenVersion 4.0 (GA) | Vorherige Versionen:Blaues HäkchenVersion 3.0Blaues HäkchenVersion 2.1

Dieser Inhalt gilt für:HäkchenVersion 3.0 (GA) | Neueste Versionen:Lila HäkchenVersion 4.0 (GA)Lila Häkchenv3.1 | Vorherige Version:Blaues HäkchenVersion 2.1

Dieser Inhalt gilt für:Häkchenv2.1 | Letzte Version:Blaues Häkchenv4.0 (GA)

Note

Die Document Intelligence-API v4.0 2024-11-30 (GA) für das vordefinierte Identitätsdokument-Modell (ID) unterstützt jetzt Identifikationsdokumente aus allen Regionen weltweit, einschließlich einer erweiterten Abdeckung über Nordamerika, Südamerika, Asien, Europa, Afrika und Ozeanien.

Das Ausweisdokumentmodell von Dokument Intelligenz kombiniert optische Zeichenerkennung (Optical Character Recognition, OCR) mit Deep Learning-Modellen, um wichtige Informationen aus Ausweisdokumenten zu analysieren und zu extrahieren. Die API analysiert Ausweisdokumente (einschließlich folgende) und gibt eine strukturierte JSON-Datendarstellung zurück.

Region Dokumenttypen
Worldwide Passbuch, Reisepass im Kartenformat
United States Führerschein, Personalausweis, Aufenthaltserlaubnis (Greencard), Sozialversicherungskarte, Wehrpass
India Führerschein, PAN Card, Aadhaar Card
Australia Führerschein, Fotokarte, Keypass-Ausweis (einschließlich digitaler Version)
Andere Führerschein, Personalausweis, Aufenthaltserlaubnis

Mit Dokument Intelligenz können Informationen aus amtlichen Ausweisen unter Verwendung des vordefinierten ID-Modells analysiert und extrahiert werden. Dabei werden unsere leistungsstarken Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR) mit ID-Erkennungsfunktionen kombiniert, um wesentliche Informationen aus internationalen Reisepässen und US-amerikanischen Führerscheinen (alle 50 Bundesstaaten). Mit der ID-API werden wesentliche Informationen aus diesen Ausweisdokumenten extrahiert, z. B. Vorname, Nachname, Geburtsdatum und Dokumentnummer. Diese API ist in Dokument Intelligenz 2.1 als Clouddienst verfügbar.

Verarbeitung von Ausweisdokumenten

Bei der Verarbeitung von Ausweisdokumenten werden die Daten aus Ausweisdokumenten entweder manuell oder mit OCR-basierten Technologien extrahiert. Die Verarbeitung von Ausweisdokumenten ist ein wichtiger Schritt in jedem Geschäftsvorgang, der einen Identitätsnachweis erfordert. Beispiele sind die Kundenüberprüfung in Banken und anderen Finanzinstituten, bei Hypothekenanträgen, Arztbesuchen, zur Verarbeitung von Anträgen, im Gastgewerbe usw. Einzelpersonen weisen ihre Identität mit ihrem Führerschein, Reisepass und ähnlichen Dokumenten nach, damit das Unternehmen sie effizient überprüfen kann, bevor es Dienstleistungen und Leistungen bereitstellt.

US-Beispielfahrerlaubnis, die mit Dokument Intelligenz Studio verarbeitet wurde

Abbildung: Führerscheinbeispiel

Datenextraktion

Der vorgefertigte ID-Dienst extrahiert die Schlüsselwerte aus den internationalen Reisepässen und den US-Führerscheinen und gibt Sie in einer organisierten strukturierten JSON-Antwort zurück.

Führerschein als Beispiel

Beispiel eines Führerscheins

Reisepass als Beispiel

Beispiel eines Reisepasses

Entwicklungsoptionen

Dokument Intelligenz Version 4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Resources Modell-ID
Ausweisdokumentmodell Document Intelligence Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Resources Modell-ID
Ausweisdokumentmodell Document Intelligence Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Dokument-Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Resources Modell-ID
Ausweisdokumentmodell Document Intelligence Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Resources
Ausweisdokumentmodell Document Intelligence-Bezeichnungstool
REST-API
Clientbibliothek SDK
Document Intelligence Docker-Container

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Model PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Read
Layout
Allgemeines Dokument
Prebuilt
Benutzerdefinierte Extraktion
Benutzerdefinierte Klassifizierung
  • Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
  • PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
  • Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
  • Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
  • Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
  • Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Abmessung entspricht etwa 8-Punkt-Text bei 150 Punkten pro Zoll.
  • Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
  • Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
  • Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
  • Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.
  • Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.

  • Unterstützte Seitenanzahl für PDF- und TIFF-Dateien: bis zu 2.000 Seiten oder nur die ersten beiden Seiten für Abonnenten der kostenlosen Version.

  • Unterstützte Dateigröße: weniger als 50 MB GESAMT; Mindestpixel: 50 x 50 px; Maximale Pixel 10.000 x 10.000 px.

Datenextraktion für das Ausweisdokumentmodell

Extrahieren Sie Daten aus Ausweisdokumenten, darunter den Namen, das Geburtsdatum und das Ablaufdatum. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Note

Dokument Intelligenz Studio ist mit den APIs der Versionen 3.1 und 3.0 und höheren Versionen verfügbar.

  1. Wählen Sie auf der Startseite von Document Intelligence StudioIdentitätsdokumente aus.

  2. Sie können die Musterrechnung analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Dokument Intelligenz-Tool für die Beschriftung von Beispielen

  1. Navigieren Sie zum Dokument Intelligenz-Beispieltool.

  2. Wählen Sie auf der Startseite des Beispieltools die Kachel Use prebuilt model to get data (Vordefiniertes Modell zum Abrufen von Daten verwenden) aus.

    Screenshot des Vorgangs zur Ergebnisanalyse des Layoutmodells.

  3. Wählen Sie im Dropdownfenster den zu analysierenden Formulartyp aus.

  4. Wählen Sie aus den folgenden Optionen eine URL zu der Datei aus, die Sie analysieren möchten:

  5. Wählen Sie im Feld Quelle die URL aus dem Dropdownmenü aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche Abrufen aus.

    Screenshot des Dropdown-Menüs für den Quellort.

  6. Fügen Sie im Feld Dokument Intelligenz-Dienstendpunkt den Endpunkt ein, den Sie mit Ihrem Dokument Intelligenz-Abonnement erhalten haben.

  7. Fügen Sie im Feld Schlüssel den Schlüssel ein, den Sie von Ihrer Dokument Intelligenz-Ressource erhalten haben.

    Screenshot: Dropdownmenü zum Auswählen des Dokumenttyps

  8. Wählen Sie Run Analysis (Analyse ausführen) aus. Das Dokument Intelligenz-Tool für die Beschriftung von Beispielen ruft die „Analyze Prebuilt“-API auf und analysiert das Dokument.

  9. Zeigen Sie die Ergebnisse an. Sehen Sie sich die extrahierten Schlüssel-Wert-Paare, die Positionen, den extrahierten markierten Text und die erkannten Tabellen an.

    Screenshot: Vorgang der Ergebnisanalyse des Identitätsmodells

  10. Laden Sie die JSON-Ausgabedatei herunter, um die ausführlichen Ergebnisse anzuzeigen.

    • Der Knoten „readResults“ enthält jede Textzeile mit der Platzierung des zugehörigen Begrenzungsrahmens auf der Seite.
    • Der Knoten „selectionMarks“ zeigt jede Auswahlmarkierung (Kontrollkästchen, Optionsfeld) und ihren Status (ausgewählt oder nicht ausgewählt) an.
    • Der Abschnitt „pageResults“ enthält die extrahierten Tabellen. Für jede Tabelle extrahiert Dokument Intelligenz den Text-, Zeilen- und Spaltenindex, die Zeilen- und Spaltenaufteilung, den Begrenzungsrahmen und Ähnliches.
    • Das Feld „documentResults“ enthält Informationen zu Schlüssel-Wert-Paaren und Positionen für die relevantesten Teile des Dokuments.

Note

Das Tool für die Beschriftung von Beispielen unterstützt das BMP-Dateiformat nicht. Diese Beschränkung ist eine Einschränkung des Tools, nicht des Dokument Intelligenz-Diensts.

Feldextraktionen

Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie auf der Seite ID-Dokument-Modellschema in unserem GitHub-Beispielrepository.

Unterstützte Dokumenttypen

Dieses Ausweismodell ist derzeit für US-Führerscheine und die biografische Seite internationaler Reisepässe (ausgenommen Visa und andere Reisedokumente) verfügbar.

Extrahierte Felder

Name Type Description Value
Country country Ländercode, konform zu ISO 3166-Standard "USA"
DateOfBirth date Geburtsdatum im Format JJJJ-MM-TT "1980-01-01"
DateOfExpiration date Ablaufdatum im Format JJJJ-MM-TT "2019-05-05"
DocumentNumber string Relevante Passnummer, Führerscheinnummer usw. "340020013"
FirstName string Extrahierter Vorname und ggf. Mittelinitial "JENNIFER"
LastName string Extrahierter Nachname "BROOKS"
Nationality country Ländercode, konform zu ISO 3166-Standard "USA"
Sex gender Mögliche extrahierte Werte: „M“, „F“, „X“ "F"
MachineReadableZone object Reisepass-MRZ wurde einschließlich zweier Zeilen von je 44 Zeichen extrahiert "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Dokumenttyp, z. B. Pass oder Führerschein "passport"
Address string Extrahierte Adresse (nur beim Führerschein) „123 STREET ADDRESS YOUR CITY WA 99999-1234“
Region string Extrahierte Region, Bundesstaat, Provinz usw. (nur Führerschein) "Washington"

Migrationsleitfaden

Nächste Schritte