Freigeben über


Nährstoff - PDF OCR

Transformieren Sie gescannte Dokumente und Bilder in durchsuchbare, bearbeitbare PDF-Dateien mit OCR-Aktionen des Nährstoffdokumentkonverters. Extrahieren Sie Text nahtlos aus PDF-Dateien mithilfe erweiterter OCR-Technologie (Optical Character Recognition) für die Indizierung, Automatisierung und Inhaltsanalyse.

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Logik-Apps Norm Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche:
     – Azure Government-Regionen
     - Azure China-Regionen
     - US Department of Defense (DoD)
Power Apps Premium Alle Power Apps-Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Power Automate Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Kontakt
Name Nährstoff (ehemals Muhimbi) Unterstützung
URL https://support.nutrient.io/hc/en-us/requests/new
Email support+low-code@nutrient.io
Connectormetadaten
Herausgeber Muhimbi handele als Nährstoff
Webseite https://www.nutrient.io/low-code/
Datenschutzrichtlinie https://www.nutrient.io/legal/privacy/
Kategorien Zusammenarbeit; Inhalt und Dateien

Ausführen von OCR für Bilder und gescannte Dokumente

Verwenden Sie den Nährstoffdokumentkonverter, um optische Zeichenerkennung (OPTICAL Character Recognition, OCR) für Bilder und gescannte Dateien über eine REST-API oder eine selbst gehostete Serverbibliothek auszuführen.

OCR-Funktionen

  • Konvertieren Sie Bilder, Scans und Faxe in durchsuchbare PDF-Dateien.
  • Erstellen Sie automatisierte Dokumentworkflows für textextraktion und PDF-Durchsuchbarkeit.

Integrationsoptionen

Integrieren Sie OCR-Funktionen in Codebeispiele in Ihre bevorzugte Sprache:

Voraussetzungen

Für die Verwendung des Nährstoffdokumentkonverters benötigen Sie ein kostenloses Konto oder ein Testkonto . Lesen Sie das Vergleichshandbuch , um die Unterschiede zwischen diesen Kontotypen zu verstehen.

Erste Schritte

Führen Sie die folgenden Schritte aus, um mit der Verwendung des Nutrient Document Converter Connectors zu beginnen:

Bekannte Probleme und Einschränkungen

Dokumente, die durch IRM-, DRM-, RMS- oder AIP-Lösungen geschützt sind, können aufgrund von Sicherheitsbeschränkungen nicht verarbeitet werden.

Für Fragen oder Hilfe wenden Sie sich an unser Supportteam.

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 100 60 Sekunden

Aktionen

Extrahieren von Text mithilfe von OCR

Extrahieren von Text aus einer PDF-Datei mit OCR

In OCRed PDF konvertieren

Führen Sie OCR für ein vorhandenes PDF-Dokument oder ein Bild aus, um eine durchsuchbare PDF-Datei zu erstellen.

Extrahieren von Text mithilfe von OCR

Extrahieren von Text aus einer PDF-Datei mit OCR

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Name der Quelldatei
source_file_name True string

Name der Quelldatei einschließlich Erweiterung

Quelldateiinhalt
source_file_content True byte

Inhalt der Datei in OCR

Language
language enum

Language

x-Koordinate
x string

X-Koordinate (in Pts, 1/72 zoll)

y-Koordinate
y string

Y-Koordinate (in Pts, 1/72 zoll)

Breite
width string

Breite des OCR-Bereichs (in Pts, 1/72 zoll)

Höhe
height string

Höhe des OCR-Bereichs (in Pts, 1/72 zoll)

Seitenzahl
page_number string

Seitenzahl (leer lassen, um alle Seiten zu ocrieren)

Leistung
performance enum

Leistung ()

Blacklist / Whitelist
characters_option enum

Option "Zeichen"

Zeichen
characters string

Zeichen zur Blacklist oder Whitelist

Verwenden der Paginierung
paginate boolean

Paginieren

Fehler beim Fehler
fail_on_error boolean

Fehler beim Fehler

Gibt zurück

Antwortdaten für OCRText-Vorgang

In OCRed PDF konvertieren

Führen Sie OCR für ein vorhandenes PDF-Dokument oder ein Bild aus, um eine durchsuchbare PDF-Datei zu erstellen.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Name der Quelldatei
source_file_name True string

Name der Quelldatei einschließlich Erweiterung

Quelldateiinhalt
source_file_content True byte

Inhalt der Datei in OCR

Language
language enum

Language

Leistung
performance enum

Leistung

Blacklist / Whitelist
characters_option enum

Option "Zeichen"

Zeichen
characters string

Zeichen zur Blacklist oder Whitelist

Verwenden der Paginierung
paginate boolean

Paginieren

Regions
regions string

Beschränken des Bereichs auf OCR auf einen oder mehrere bestimmte Bereiche

Fehler beim Fehler
fail_on_error boolean

Fehler beim Fehler

Gibt zurück

Antwortdaten für alle Vorgänge

Definitionen

ocr_operation_response

Antwortdaten für OCRText-Vorgang

Name Pfad Typ Beschreibung
Textausgang
out_text string

Extrahierter OCRed-Text in Nur-Text.

Basisdateiname
base_file_name string

Name der Eingabedatei ohne Die Erweiterung.

Ergebniscode
result_code enum

Vorgangsergebniscode.

Ergebnisdetails
result_details string

Details zum Vorgangsergebnis.

operation_response

Antwortdaten für alle Vorgänge

Name Pfad Typ Beschreibung
Verarbeiteter Dateiinhalt
processed_file_content byte

Vom Muhimbi-Konverter generierte Datei.

Basisdateiname
base_file_name string

Name der Eingabedatei ohne Die Erweiterung.

Ergebniscode
result_code enum

Vorgangsergebniscode.

Ergebnisdetails
result_details string

Details zum Vorgangsergebnis.