Nährstoff - PDF OCR
Transformieren Sie gescannte Dokumente und Bilder in durchsuchbare, bearbeitbare PDF-Dateien mit OCR-Aktionen des Nährstoffdokumentkonverters. Extrahieren Sie Text nahtlos aus PDF-Dateien mithilfe erweiterter OCR-Technologie (Optical Character Recognition) für die Indizierung, Automatisierung und Inhaltsanalyse.
Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:
| Dienstleistung | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Logik-Apps | Norm | Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche: – Azure Government-Regionen - Azure China-Regionen - US Department of Defense (DoD) |
| Power Apps | Premium | Alle Power Apps-Regionen mit Ausnahme der folgenden: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Power Automate | Premium | Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche: - US Government (GCC) - US Government (GCC High) - China Cloud betrieben von 21Vianet - US Department of Defense (DoD) |
| Kontakt | |
|---|---|
| Name | Nährstoff (ehemals Muhimbi) Unterstützung |
| URL | https://support.nutrient.io/hc/en-us/requests/new |
| support+low-code@nutrient.io |
| Connectormetadaten | |
|---|---|
| Herausgeber | Muhimbi handele als Nährstoff |
| Webseite | https://www.nutrient.io/low-code/ |
| Datenschutzrichtlinie | https://www.nutrient.io/legal/privacy/ |
| Kategorien | Zusammenarbeit; Inhalt und Dateien |
Ausführen von OCR für Bilder und gescannte Dokumente
Verwenden Sie den Nährstoffdokumentkonverter, um optische Zeichenerkennung (OPTICAL Character Recognition, OCR) für Bilder und gescannte Dateien über eine REST-API oder eine selbst gehostete Serverbibliothek auszuführen.
OCR-Funktionen
- Konvertieren Sie Bilder, Scans und Faxe in durchsuchbare PDF-Dateien.
- Erstellen Sie automatisierte Dokumentworkflows für textextraktion und PDF-Durchsuchbarkeit.
Integrationsoptionen
Integrieren Sie OCR-Funktionen in Codebeispiele in Ihre bevorzugte Sprache:
- Ausführen von OCR mit C#
- Ausführen von OCR mit Java
- Ausführen von OCR mit .NET Core
- Ausführen von OCR mit PHP
- Ausführen von OCR mit JavaScript
Voraussetzungen
Für die Verwendung des Nährstoffdokumentkonverters benötigen Sie ein kostenloses Konto oder ein Testkonto . Lesen Sie das Vergleichshandbuch , um die Unterschiede zwischen diesen Kontotypen zu verstehen.
Erste Schritte
Führen Sie die folgenden Schritte aus, um mit der Verwendung des Nutrient Document Converter Connectors zu beginnen:
- Melden Sie sich für eine 30-tägige Testversion an, indem Sie dieses Formular ausfüllen.
- Nach der Übermittlung des Formulars erhalten Sie eine E-Mail mit Ihren Testaktivierungsdetails.
- Eine exemplarische Vorgehensweise für den Prozess finden Sie im Video "Erste Schritte ".
- Ausführliche Anweisungen finden Sie im Dokumentkonverter für Power Automate-Anleitungen .
- In den Lernprogrammen für Power Automate und Logic Apps finden Sie praktische Beispiele.
Bekannte Probleme und Einschränkungen
Dokumente, die durch IRM-, DRM-, RMS- oder AIP-Lösungen geschützt sind, können aufgrund von Sicherheitsbeschränkungen nicht verarbeitet werden.
Für Fragen oder Hilfe wenden Sie sich an unser Supportteam.
Drosselungsgrenzwerte
| Name | Aufrufe | Verlängerungszeitraum |
|---|---|---|
| API-Aufrufe pro Verbindung | 100 | 60 Sekunden |
Aktionen
| Extrahieren von Text mithilfe von OCR |
Extrahieren von Text aus einer PDF-Datei mit OCR |
| In OCRed PDF konvertieren |
Führen Sie OCR für ein vorhandenes PDF-Dokument oder ein Bild aus, um eine durchsuchbare PDF-Datei zu erstellen. |
Extrahieren von Text mithilfe von OCR
Extrahieren von Text aus einer PDF-Datei mit OCR
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
Name der Quelldatei
|
source_file_name | True | string |
Name der Quelldatei einschließlich Erweiterung |
|
Quelldateiinhalt
|
source_file_content | True | byte |
Inhalt der Datei in OCR |
|
Language
|
language | enum |
Language |
|
|
x-Koordinate
|
x | string |
X-Koordinate (in Pts, 1/72 zoll) |
|
|
y-Koordinate
|
y | string |
Y-Koordinate (in Pts, 1/72 zoll) |
|
|
Breite
|
width | string |
Breite des OCR-Bereichs (in Pts, 1/72 zoll) |
|
|
Höhe
|
height | string |
Höhe des OCR-Bereichs (in Pts, 1/72 zoll) |
|
|
Seitenzahl
|
page_number | string |
Seitenzahl (leer lassen, um alle Seiten zu ocrieren) |
|
|
Leistung
|
performance | enum |
Leistung () |
|
|
Blacklist / Whitelist
|
characters_option | enum |
Option "Zeichen" |
|
|
Zeichen
|
characters | string |
Zeichen zur Blacklist oder Whitelist |
|
|
Verwenden der Paginierung
|
paginate | boolean |
Paginieren |
|
|
Fehler beim Fehler
|
fail_on_error | boolean |
Fehler beim Fehler |
Gibt zurück
Antwortdaten für OCRText-Vorgang
In OCRed PDF konvertieren
Führen Sie OCR für ein vorhandenes PDF-Dokument oder ein Bild aus, um eine durchsuchbare PDF-Datei zu erstellen.
Parameter
| Name | Schlüssel | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
Name der Quelldatei
|
source_file_name | True | string |
Name der Quelldatei einschließlich Erweiterung |
|
Quelldateiinhalt
|
source_file_content | True | byte |
Inhalt der Datei in OCR |
|
Language
|
language | enum |
Language |
|
|
Leistung
|
performance | enum |
Leistung |
|
|
Blacklist / Whitelist
|
characters_option | enum |
Option "Zeichen" |
|
|
Zeichen
|
characters | string |
Zeichen zur Blacklist oder Whitelist |
|
|
Verwenden der Paginierung
|
paginate | boolean |
Paginieren |
|
|
Regions
|
regions | string |
Beschränken des Bereichs auf OCR auf einen oder mehrere bestimmte Bereiche |
|
|
Fehler beim Fehler
|
fail_on_error | boolean |
Fehler beim Fehler |
Gibt zurück
Antwortdaten für alle Vorgänge
- Body
- operation_response
Definitionen
ocr_operation_response
Antwortdaten für OCRText-Vorgang
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Textausgang
|
out_text | string |
Extrahierter OCRed-Text in Nur-Text. |
|
Basisdateiname
|
base_file_name | string |
Name der Eingabedatei ohne Die Erweiterung. |
|
Ergebniscode
|
result_code | enum |
Vorgangsergebniscode. |
|
Ergebnisdetails
|
result_details | string |
Details zum Vorgangsergebnis. |
operation_response
Antwortdaten für alle Vorgänge
| Name | Pfad | Typ | Beschreibung |
|---|---|---|---|
|
Verarbeiteter Dateiinhalt
|
processed_file_content | byte |
Vom Muhimbi-Konverter generierte Datei. |
|
Basisdateiname
|
base_file_name | string |
Name der Eingabedatei ohne Die Erweiterung. |
|
Ergebniscode
|
result_code | enum |
Vorgangsergebniscode. |
|
Ergebnisdetails
|
result_details | string |
Details zum Vorgangsergebnis. |