Freigeben über


Aquaforest PDF

Aquaforest PDF Connector enthält eine Gruppe von Aktionen, die verschiedene PDF-Vorgänge wie Teilen, Textextraktion, Barcodeextraktion und OCR-Vorgänge für Office 365 und Power Automate ausführen.

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Logik-Apps Norm Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche:
     – Azure Government-Regionen
     - Azure China-Regionen
     - US Department of Defense (DoD)
Power Apps Premium Alle Power Apps-Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Power Automate Premium Alle Power Automate-Regionen mit Ausnahme der folgenden Bereiche:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Kontakt
Name Aquaforest-Unterstützung
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email support@aquaforest.com
Connectormetadaten
Herausgeber Aquaforest Limited
Webseite https://www.aquaforest.com/en/aquaforest-connector.asp
Datenschutzrichtlinie https://www.aquaforest.com/en/privacy policy.pdf
Kategorien Inhalt und Dateien; Daten

Aquaforest PDF Connector enthält eine Gruppe von Aktionen, die verschiedene PDF-Vorgänge wie Teilen, Textextraktion, Barcodeextraktion und OCR-Vorgänge für Office 365 und Flow ausführen.

Voraussetzungen

Zunächst müssen Sie ein Aquaforest PDF-API-Konto erstellen. Dieses Konto wird zum Verwalten von Aquaforest PDF-Aktionen und der Aquaforest-PDF-API verwendet. Verwenden Sie Ihre aktive E-Mail-Adresse, da das Abonnement mit dieser Adresse verknüpft wird. Wenn Sie bereits über ein Konto verfügen, melden Sie sich einfach hier an.

So erhalten Sie Anmeldeinformationen

  1. Melden Sie sich beim Entwicklerportal an, wechseln Sie zur Seite " Produkte ", und wählen Sie das Produkt aus, das Sie abonnieren möchten.

  2. Klicken Sie auf die Schaltfläche " Abonnieren ".

  3. Klicken Sie auf die Schaltfläche " Bestätigen ", um Ihre Abonnementanfrage zu bestätigen.

  4. Sie können auf Ihre API-Schlüssel auf Ihrer Profilseite zugreifen.

Eine Verbindung wird erstellt

Der Connector unterstützt die folgenden Authentifizierungstypen:

Vorgabe Parameter zum Erstellen einer Verbindung. Alle Regionen Nicht teilbar

Vorgabe

Anwendbar: Alle Regionen

Parameter zum Erstellen einer Verbindung.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
API-Schlüssel securestring Der API-Schlüssel für diese API Richtig

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 100 60 Sekunden

Aktionen

Abrufen von Daten aus PDF

Diese Aktion extrahiert wichtige Daten aus PDF-Dateien in Form von Schlüssel-Wert-Paaren.

ABRUFEN von PDF-Eigenschaften

Ruft die Informationen zu einer PDF-Datei ab.

Abrufen von Text aus PDF

Abrufen von Text aus PDF-Dateien basierend auf dem Textspeicherort und regulären Ausdrücken. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Extrahieren von PDF-Seiten nach Barcode

Extrahieren Sie PDF-Dateien basierend auf Barcode-Übereinstimmungen, die vom Benutzer definiert wurden. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Extrahieren von PDF-Seiten nach Text

Extrahieren Sie PDF-Dateien basierend auf textbezogenen Übereinstimmungen, die vom Benutzer definiert wurden. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

OCR PDF oder Bilder

Generieren Sie durchsuchbare PDF aus einer Bild-PDF oder gescannten Bildern. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

PDF nach Seite teilen

Teilt PDF-Dateien basierend auf geteilten Optionen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation.

Strichcodewert abrufen

Strichcode aus PDF abrufen. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Teilen der PDF-Datei nach Text-Übereinstimmung

Teilt PDF-Dateien basierend auf textbezogenen Übereinstimmungen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation. Darüber hinaus ist das Aquaforest Zonal Extraction Tool unter [https://www.aquaforest.com/en/zone/get-pdf-zone.html] verfügbar.

Teilen von PDF durch Barcode

Teilt PDF-Dateien basierend auf Barcode-Übereinstimmungen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation. Darüber hinaus ist das Aquaforest Zonal Extraction Tool unter [https://www.aquaforest.com/en/zone/get-pdf-zone.html] verfügbar.

Abrufen von Daten aus PDF

Diese Aktion extrahiert wichtige Daten aus PDF-Dateien in Form von Schlüssel-Wert-Paaren.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Name
settingName True string

Geben Sie hier den Namen der Einstellung ein.

Wert
settingValue True string

Geben Sie hier den Wert der Einstellung ein.

Zuverlässigkeitsbewertung
confidenceScore number

Legen Sie eine höhere Konfidenzbewertung fest, um Werte mit niedrigerer Konfidenz herauszufiltern. Sie können einen beliebigen Wert zwischen 0 und 1 festlegen. Wir empfehlen ab 0.5

Datumskonvertierung
dateAsISO string

Wählen Sie aus, welches Format datumswert zurückgegeben werden soll.

Erwartete Schlüssel
expectedKeys string

Stellen Sie einen Schlüsselnamen pro Zeile bereit, um Werte für spätere Aktionen verfügbar zu machen, ohne JSON zu analysieren.

Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Seitenlimit
pageLimit integer

Maximale Anzahl der zu verarbeitenden Seiten

Seitenbereich
pageRange string

Eine Zeichenfolgendarstellung der Seitenzahlen, die Sie verarbeiten möchten. Z.B. 1,3-4

Währungssymbol streifen
stripCurrencySymbol boolean

Legen Sie diesen Wert auf "true" fest, wenn die Symbole und Zeichenfolgen entfernt werden sollen, bevor Währungswerte zurückgegeben werden.

Synonym übereinstimmen
synonym boolean

Legen Sie diesen Wert auf "true" fest, wenn wir alle Schlüssel zurückgeben möchten, die Synonyme für den erwarteten Schlüssel sind.

Synonymwörterbuch
synonymDictionary string

Sie können ein JSON-Array von "entry"-Objekten bereitstellen, wobei jedes Objekt eine Liste von Synonymen in einem Array enthält. Wenn Sie z. B. "Rechnungsnummer" und "Rechnungsnummer" (Groß-/Kleinschreibung) als denselben Schlüssel interpretieren möchten, verwenden Sie den folgenden JSON-Code: [{'entry': [ 'Rechnungsnummer', 'Rechnungsnummer' ]}]

Kürzen von Symbolen
trimSymbols boolean

Legen Sie diesen Wert auf "true" fest, wenn wir alle führenden und nachgestellten Symbole aus den gefundenen Schlüsseln entfernen möchten, bevor wir sie mit einem erwarteten Schlüssel abgleichen.

Gibt zurück

Die Ausgaben dieses Vorgangs sind dynamisch.

ABRUFEN von PDF-Eigenschaften

Ruft die Informationen zu einer PDF-Datei ab.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Seitenlimit
pageLimit integer

Die maximale Anzahl der zu verarbeitenden Seiten wird nur verwendet, um zu überprüfen, ob Seiten ausgeblendeten Text enthalten oder ob PDF durchsuchbar ist.

Gibt zurück

Abrufen von Text aus PDF

Abrufen von Text aus PDF-Dateien basierend auf dem Textspeicherort und regulären Ausdrücken. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Keine Text-Übereinstimmungsvorlage
noTextTemplate True string

Vorlage für den zurückgegebenen Text, wenn keine Übereinstimmung gefunden wird

Seitentrennzeichen
pageSeparator string

Stellen Sie ein Seitentrennzeichen bereit, damit Sie wissen können, wo sich die Seitenumbrüche befinden.

Seiten
pagerange string

Geben Sie einen Seitenbereich an, aus dem Sie Text extrahieren möchten. Dabei kann es sich um eine einzelne Seitenzahl (1), mehrere Seitenzahlen handeln, die durch Kommas (1,2,3), einen Seitenbereich (1-4) oder eine Mischung aus allen (1,2,4-7) getrennt sind.

Dateiname
sourceFileName True string

Der Name der Quelldatei

Textergebnisvorlage
textResultTemplate True string

Vorlage für den zurückgegebenen Text, wenn eine Übereinstimmung gefunden wird

Wert
expression array of string

Geben Sie hier einen oder mehrere Werte an, die mit der oben genannten Eigenschaft verwendet werden sollen. Wir geben den ersten Textwert zurück, der der oben angegebenen Regel entspricht.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seite (veraltet)
pagenumber integer

Diese Eigenschaft ist veraltet, wir empfehlen Ihnen, die Pages-Eigenschaft zu verwenden. Die Pages-Eigenschaft gilt für alle Zonen und ermöglicht es Ihnen, die zu verarbeitenden Seiten auszuwählen.

Auswählen
position string

Verwenden Sie diese Option, um den Text zu verfeinern, den Sie extrahieren, und wählen Sie eine Option aus, die Ihren Anforderungen entspricht.

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir jedem extrahierten Text zu und geben die Übereinstimmung zurück.

Gibt zurück

Extrahieren von PDF-Seiten nach Barcode

Extrahieren Sie PDF-Dateien basierend auf Barcode-Übereinstimmungen, die vom Benutzer definiert wurden. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Dateinamevorlage
fileNameTemplate True string

Vorlage für die Ausgabedatei, wenn barcode gefunden wird

Keine Dateivorlage
noTextFileName True string

Vorlage für die Ausgabedatei, wenn kein Barcode gefunden wird

Dateiname
sourceFileName True string

Der Name der Quelldatei

Typ
barcodeFormats array of string

Geben Sie die Typen von Barcode an, die Sie identifizieren möchten.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir mit jedem extrahierten Barcode überein und geben die Übereinstimmung zurück.

Gibt zurück

Extrahieren von PDF-Seiten nach Text

Extrahieren Sie PDF-Dateien basierend auf textbezogenen Übereinstimmungen, die vom Benutzer definiert wurden. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Dateinamevorlage
fileNameTemplate True string

Vorlage für die Ausgabedatei, wenn der Text gefunden wird

Keine Dateivorlage
noTextFileName True string

Vorlage für die Ausgabedatei, wenn keine Textausstimmung gefunden wird

Dateiname
sourceFileName True string

Der Name der Quelldatei

Wert
expression array of string

Geben Sie hier einen oder mehrere Werte an, die mit der oben genannten Eigenschaft verwendet werden sollen. Wir geben den ersten Textwert zurück, der der oben angegebenen Regel entspricht.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Auswählen
position string

Verwenden Sie diese Option, um den Text zu verfeinern, den Sie extrahieren, und wählen Sie eine Option aus, die Ihren Anforderungen entspricht.

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir jedem extrahierten Text zu und geben die Übereinstimmung zurück.

Gibt zurück

OCR PDF oder Bilder

Generieren Sie durchsuchbare PDF aus einer Bild-PDF oder gescannten Bildern. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
AquaforestImageTimeout
aquaforestImageTimeout integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Autor
author string

Legen Sie einen benutzerdefinierten Autor in den PDF-Ausgabedokumenteigenschaften fest.

Automatisches Drehen
autorotate boolean

Automatisches Drehen des Bilds – dadurch wird sichergestellt, dass der gesamte Text normal ausgerichtet ist.

Binarize
binarize integer

Dieser Wert sollte in der Regel nur unter Anleitung des technischen Supports verwendet werden. Sie kann steuern, wie Farbbilder verarbeitet werden, und die Binarisierung mit einem bestimmten Schwellenwert erzwingen. Ein Wert von 200 wurde im Allgemeinen gezeigt, um gute Ergebnisse beim Testen zu liefern, aber dies sollte mit "typischen" Kundendokumenten bestätigt werden. Durch Festlegen auf -1 wird eine alternative Methode verwendet, die versucht, den Text von allen Hintergrundbildern oder Farben zu trennen. Dadurch können verbesserte OCR-Ergebnisse für bestimmte Dokumente wie Zeitungs- und Zeitschriftenseiten erzielt werden.

Grenzwert für schwarze Pixel
blackPixelLimit float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Schwellenwert für leere Seiten
blankPageThreshold integer

Verwenden Sie diese Option, um die Mindestanzahl von "On Pixels" festzulegen, die im Bild vorhanden sein muss, damit eine Seite nicht als leer angesehen wird. Ein Wert von -1 deaktiviert die Erkennung leerer Seiten.

Feldgröße
boxSize integer

Diese Option eignet sich ideal für Formulare, bei denen manchmal Felder um Text herum dazu führen können, dass ein Bereich als Grafiken identifiziert wird. Mit dieser Option werden Felder aus der temporären Kopie des vom OCR-Modul verwendeten Images entfernt. Es werden keine Felder aus dem endgültigen Bild entfernt. Technisch entfernt diese Option verbundene Elemente mit einem Minimalbereich (in Pixeln und definiert durch diese Eigenschaft). Diese Option wird derzeit nur für biale Bilder angewendet.

ConvertToTiff
convertToTiff boolean

Jede Seite im PDF-Dokument wird in ein TIFF-Bild gerastert.

CreateProcess
createProcess boolean

Legen Sie diesen Wert auf "true" fest, wenn Sie den Prozess über Pinvoke starten möchten.

Erstellungsdatum
creationDate string

Legen Sie ein benutzerdefiniertes Erstellungsdatum in den PDF-Ausgabedokumenteigenschaften fest. Die Datumszeichenfolge muss sich im Format "jjjj-MM-tt HH:mm:ss" befinden.

Schreibtischneue
deskew boolean

Deskew (glätten) das Bild.

Despeckle
despeckle integer

Dadurch werden alle getrennten Elemente innerhalb des Bilds entfernt, die Höhe oder Breite in Pixeln kleiner als die angegebene Abbildung aufweisen. Der Maximalwert ist 9, und der Standardwert ist 0.

DictionaryLookup
dictionaryLookup integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Dotmatrix
dotmatrix boolean

Legen Sie diesen Wert auf "true" fest, um die Erkennung von Dot-Matrix-Schriftarten zu verbessern. Der Standardwert ist „false“. Wenn für Nicht-Dot-Matrix-Schriftarten "true" festgelegt ist, kann die Erkennung schlecht sein.

Debugausgabe aktivieren
enableDebugOutput boolean

Aktiviert die Debugausgabe.

PDF komprimieren (MRC)
enableMrc boolean

Dies ermöglicht die Gemischte Rasterkomprimierung, wodurch die Ausgabegröße von PDF-Dateien, die Farbscans bestehen, erheblich reduziert werden kann. Beachten Sie, dass diese Option nur geeignet ist, wenn es sich bei der Quelle nicht um eine PDF-Datei oder die Verwendung von ConvertToTiff handelt.

PDF/A-Ausgabe
enablePDFAOutput boolean

Gibt an, ob sie als PDF/A ausgegeben werden sollen.

Fehlermodus
errorMode integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Quelldateiinhalt
fileContent True byte

Inhalt der Datei in OCR

Quelldateiname mit Erweiterung
fileNameWithExtension True string

Der Name der Quelldatei mit Der Erweiterung oder nur der Erweiterung (mit einem vorangestellten Punkt '.'

Flip-Erkennung
flipDetect integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Graustufenqualität
grayscaleQuality integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Heuristik
heuristics integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Jbig2EncFlags
jbig2EncFlags string

Dies sind die Flags, die an die Anwendung übergeben werden, die zum Generieren von JBIG2-Versionen von Bildern verwendet wird, die bei der PDF-Generierung verwendet werden (vorausgesetzt, diese Komprimierung ist aktiviert). Diese Option sollte in der Regel nur unter Anleitung des technischen Supports verwendet werden.

Language
language enum

Wenn Sie eine der folgenden Optionen auswählen, wird die sprache festgelegt, die für die OCR-Verarbeitung verwendet werden soll. Die Standardsprache ist Deutsch.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

Wenn es ein Bild gibt, das 1bpp ist und eine LZW-Komprimierung aufweist, kann die Vorverarbeitung dazu führen, dass die Farbe des Bilds invertiert wird (Schwarz zu Weiß und Weiß in Schwarz). Legen Sie diesen Wert auf "true" fest, um dies zu vermeiden.

Maximale Schreibtischneue
maxDeskew float

Maximaler Winkel, um den eine Seite neu erstellt wird. Diese Option sollte in der Regel nur unter Anleitung durch technischen Support (support@aquaforest.com) verwendet werden.

Minimale Vertrauenswürdigkeit des Schreibtischs
minDeskewConfidence float

Diese Option sollte in der Regel nur unter Anleitung durch technischen Support (support@aquaforest.com) verwendet werden.

Änderungsdatum
modifiedDate string

Legen Sie ein benutzerdefiniertes Änderungsdatum in den PDF-Ausgabedokumenteigenschaften fest. Die Datumszeichenfolge muss sich im Format "jjjj-MM-tt HH:mm:ss" befinden.

Morph
morph string

Morphologische Optionen, die vor OCR auf das binarisierte Bild angewendet werden. Wenn "Auf leere" festgelegt ist, wird keine angewendet. Allgemeine Optionen umfassen die unten aufgeführten Optionen, aber für weitere Optionen wenden Sie sich bitte an support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Samplinggröße für den Hintergrundteil des Bilds. Je höher die Zahl ist, desto größer ist die Größe der Bildblöcke, die für die Durchschnittlichkeit verwendet werden, was zu einer Verringerung der Größe, aber auch zur Qualität führt. Standardwert ist 3

MrcForegroundFactor
mrcForegroundFactor integer

Samplinggröße für den Vordergrundteil des Bilds. Je höher die Zahl ist, desto größer ist die Größe der Bildblöcke, die für die Durchschnittlichkeit verwendet werden, was zu einer Verringerung der Größe, aber auch zur Qualität führt. Standardwert ist 3

MrcQuality
mrcQuality integer

JPEG-Qualitätseinstellung (Prozentwert 1 - 100) zum Speichern der Hintergrund- und Vordergrundbilder. Standardwert ist 75

MrcTimeout
mrcTimeout integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

NoPictures
noPictures boolean

Wenn ein Dokumentbereich standardmäßig als Grafikbereich identifiziert wird, wird für diesen Bereich keine OCR-Verarbeitung ausgeführt. Bestimmte Dokumente können jedoch Bereiche oder Felder enthalten, die als "Grafik" oder "Bild"-Bereiche identifiziert werden, die aber tatsächlich nützlichen Text enthalten. Wenn Sie "NoPictures" auf "True" festlegen, werden bereiche ignoriert, die als Bilder identifiziert werden, während sie auf "False" festgelegt werden, wird OCR von Als Bilder identifizierten Bereichen erzwungen.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

OcrTimeout
ocrTimeout integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Kennwort
password string

Das Kennwort zum Öffnen der Quell-PDF-Datei

PdfToImageBpp
pdfToImageBpp enum

Die Bits pro Pixel, die bei Verwendung des Moduls 1 für die rasterisierte PDF-Seite verwendet werden sollen. Dies gilt nur für Dokumente, die mit ConvertToTiff verarbeitet werden. Der Standardwert für diese Eigenschaft wird von der PDF-Seite übernommen.

PdfToImageCompression
pdfToImageCompression enum

Die Komprimierung, die auf die von jeder Seite der QUELL-PDF-Datei extrahierten oder gerasterten Bilder festgelegt werden soll. Diese Bilder werden dann ocRed, um die durchsuchbare PDF zu erstellen. Der Standardwert für diese Eigenschaft wird von jeder Seite in der PDF-Quelldatei übernommen.

PdfToImageDpi
pdfToImageDpi enum

Der DPI-Wert, der auf die Bilder festgelegt werden soll, die von jeder Seite der QUELL-PDF-Datei gerastert werden. Diese Bilder werden dann ocRed, um die durchsuchbare PDF zu erstellen. Der Standardwert für diese Eigenschaft wird von jeder Seite in der PDF-Quelldatei übernommen.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

Diese Einstellung ist hilfreich beim Umgang mit Dokumenten, die Vektorobjekte enthalten (z. B. CAD-Zeichnungen). Standardmäßig werden Seiten, die nur Vektorobjekte enthalten, gerastert. Seiten, die keine Bilder enthalten, aber Vektorobjekte enthalten, sowie elektronischer Text werden von der Rasterung übersprungen. Manchmal kann es jedoch ein Zeichenblatt geben, das Vektorobjekte (CAD-Zeichnungen) enthält, aber sein Titel kann sich in elektronischem Text befinden. Um das Rastern von Seiten wie diesen zu erzwingen, legen Sie diese Eigenschaft auf "true" fest.

PdfToImageIncludeText
pdfToImageIncludeText boolean

Wenn dieser Wert auf "False" festgelegt ist, wird verhindert, dass die Konvertierung von echtem Text (d. h. elektronisch generiert wird, im Gegensatz zu Text, der Teil eines gescannten Bilds ist) in den aus der PDF-Datei extrahierten Seitenbildern gerendert wird. Dies liegt daran, dass der Text bereits durchsuchbar ist und daher im Allgemeinen keine OCR erfordert. Der Wert kann jedoch auf "True" festgelegt werden, wenn die OCR für diesen tatsächlichen Text erforderlich ist.

PdfToImageMaxRes
pdfToImageMaxRes integer

Die maximale Auflösung der gerasterten Bilder. Wenn die von der PDF-Seite abgerufene Auflösung größer als dieser Wert ist, wird sie auf diesen Wert festgelegt. Der Standardwert für diese Eigenschaft ist 600.

PdfToImageMinRes
pdfToImageMinRes integer

Die minimale Auflösung der gerasterten Bilder. Wenn die von der PDF-Seite abgerufene Auflösung niedriger als dieser Wert ist, wird sie auf diesen Wert festgelegt. Der Standardwert für diese Eigenschaft ist 200.

PDF/A-Version
pdfaVersion enum

Die PDF/A-Version.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

RemoveBlankPage
removeBlankPage boolean

Entfernen Sie leere Seiten, wenn BlankPageThreshold größer als -1 und ConvertToTiff true ist.

RemoveLines
removeLines boolean

Entfernen Sie Zeilen aus Bildern, die eine bessere Erkennung aufweisen.

RestartEngineEvery
restartEngineEvery integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Lesezeichen beibehalten
retainBookmarks boolean

Behält alle Textmarken aus der Quelldatei in der Ausgabe bei, wenn ConvertToTiff verwendet wird.

Erstellungsdatum beibehalten
retainCreationDate boolean

Behält das Erstellungsdatum der Quelldatei in den PDF-Ausgabedokumenteigenschaften bei.

Aufbewahren von Metadaten
retainMetadata boolean

Behält alle Metadaten aus der Quelldatei in der Ausgabe bei, wenn ConvertToTiff verwendet wird.

Änderungsdatum beibehalten
retainModifiedDate boolean

Behält das Änderungsdatum der Quelldatei in den PDF-Ausgabedokumenteigenschaften bei.

Anzeigeneinstellungen beibehalten
retainViewerPreferences boolean

Behält alle PDF-Viewer-Einstellungen, den Seitenmodus und das Seitenlayout aus der Quelldatei in der Ausgabe bei verwendung von ConvertToTiff bei.

SavePredespeckle
savePredespeckle boolean

Dadurch wird das originale Bild (d. h. vor dem Anwenden der Vorverarbeitung) in der PDF-Ausgabe verwendet.

Tabellen
tables boolean

Diese Option, wenn sie auf "true" festgelegt ist, versucht, OCR in Tabellenzellen zu öffnen.

TextLayerFilterHeight
textLayerFilterHeight integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterPercentage
textLayerFilterPercentage float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterRatio
textLayerFilterRatio float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterWidth
textLayerFilterWidth integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Aufräumen-Modus
tidyUpMode integer

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

PDF/A überprüfen
validatePDFA boolean

Gibt an, ob das PDF/A-Dokument nach der Konvertierung überprüft werden soll.

Schwellenwert für Die Übereinstimmung zwischen Word und Word
wordMatchThreshold float

Wenden Sie sich an den technischen Support (support@aquaforest.com), um Anleitungen zur Verwendung dieser Eigenschaft zu erhalten.

Gibt zurück

Antwortdaten für OCR-Vorgang

PDF nach Seite teilen

Teilt PDF-Dateien basierend auf geteilten Optionen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei.

Ausgabedateiname
fileNameTemplate True string

Zieldateivorlage, die %UNIQUEn (eindeutige Zahl beginnend mit 1, Nullabstand bis n Ziffern) und %FILENAME (originaler Dateiname ohne Die Erweiterung) enthalten kann.

Dateiname
sourceFileName True string

Der Name der Quelldatei.

Geteilter Typ
splitOption True string

Wählen Sie den geteilten Vorgang aus, der für jede Datei verwendet werden soll.

Seitenbereich
pageRange string

Satz von Seitenbereichen durch Kommas getrennt, die definieren, welche Seiten aus dem Original extrahiert werden sollen.

Wiederholen Sie alle
repeatEvery integer

Wenden Sie den Seitenbereich auf jede Gruppe von Seitenbereichsseiten innerhalb des Dokuments an. Wenn beispielsweise 2-4 für Seitenbereiche angegeben ist und 4 als wiederholter Bereich angegeben wird, wird der Bereich alle 4 Seiten erneut angewendet.

Lesezeichen beibehalten
retainBookmarks boolean

Generierte Dateien enthalten Lesezeichen aus der originalen Datei.

Aufbewahren von Metadaten
retainMetadata boolean

Generierte Dateien enthalten Metadaten (z. B. Autor und Titel) aus der ursprünglichen Datei.

Gibt zurück

Strichcodewert abrufen

Strichcode aus PDF abrufen. Weitere Informationen finden Sie unter [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Barcodeergebnisvorlage
barcodeResultTemplate True string

Vorlage für das Ausgabetextergebnis, wenn ein Barcode gefunden wird

Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Keine Barcodevorlage
noBarcodeTemplate True string

Vorlage für das Ausgabetextergebnis, wenn kein Barcode gefunden wird

Seitentrennzeichen
pageSeparator string

Stellen Sie ein Seitentrennzeichen bereit, damit Sie wissen können, wo sich die Seitenumbrüche befinden.

Seiten
pagerange string

Geben Sie einen Seitenbereich an, aus dem Sie Text extrahieren möchten. Dabei kann es sich um eine einzelne Seitenzahl (1), mehrere Seitenzahlen handeln, die durch Kommas (1,2,3), einen Seitenbereich (1-4) oder eine Mischung aus allen (1,2,4-7) getrennt sind.

Dateiname
sourceFileName True string

Der Name der Quelldatei

Typ
barcodeFormats array of string

Geben Sie die Typen von Barcode an, die Sie identifizieren möchten.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seite (veraltet)
pagenumber integer

Diese Eigenschaft ist veraltet, wir empfehlen Ihnen, die Pages-Eigenschaft zu verwenden. Die Pages-Eigenschaft gilt für alle Zonen und ermöglicht es Ihnen, die zu verarbeitenden Seiten auszuwählen.

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir jedem extrahierten Text zu und geben die Übereinstimmung zurück.

Gibt zurück

Teilen der PDF-Datei nach Text-Übereinstimmung

Teilt PDF-Dateien basierend auf textbezogenen Übereinstimmungen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation. Darüber hinaus ist das Aquaforest Zonal Extraction Tool unter [https://www.aquaforest.com/en/zone/get-pdf-zone.html] verfügbar.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Dateinamevorlage
fileNameTemplate True string

Vorlage für die Ausgabedatei, wenn der Text gefunden wird

Seiten ohne Übereinstimmung
noMatch string

Abhängig von der oben ausgewählten Geteilten Option werden einige Seiten keinen Textwert extrahiert. Wählen Sie aus, was diese Seiten tun sollen.

Keine Dateivorlage
noTextFileName True string

Vorlage für die Ausgabedatei, wenn keine Textausstimmung gefunden wird

Dateiname
sourceFileName True string

Der Name der Quelldatei

Ausgabedateioptionen
splitOption string

Wählen Sie den Speicherort der Seite mit dem Barcode in den Ausgabedateien aus dem geteilten Vorgang aus.

Wert
expression array of string

Geben Sie hier einen oder mehrere Werte an, die mit der oben genannten Eigenschaft verwendet werden sollen. Wir geben den ersten Textwert zurück, der der oben angegebenen Regel entspricht.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Auswählen
position string

Verwenden Sie diese Option, um den Text zu verfeinern, den Sie extrahieren, und wählen Sie eine Option aus, die Ihren Anforderungen entspricht.

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir jedem extrahierten Text zu und geben die Übereinstimmung zurück.

Gibt zurück

Teilen von PDF durch Barcode

Teilt PDF-Dateien basierend auf Barcode-Übereinstimmungen, die vom Benutzer definiert wurden. Besuchen Sie [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] zur Dokumentation. Darüber hinaus ist das Aquaforest Zonal Extraction Tool unter [https://www.aquaforest.com/en/zone/get-pdf-zone.html] verfügbar.

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
Inhalt der Datei
fileContent True byte

Der Inhalt der Quelldatei

Dateinamevorlage
fileNameTemplate True string

Vorlage für die Ausgabedatei, wenn barcode gefunden wird

Seiten ohne Übereinstimmung
noMatch string

Abhängig von der oben ausgewählten Geteilten Option weisen einige Seiten keinen Barcodewert auf. Wählen Sie aus, was diese Seiten tun sollen.

Keine Strichcode-Übereinstimmungsvorlage
noTextFileName True string

Vorlage für die Ausgabedatei, wenn kein Barcode gefunden wird

Dateiname
sourceFileName True string

Der Name der Quelldatei

Ausgabedateioptionen
splitOption string

Verwenden Sie diese Option, um den Text zu verfeinern, den Sie extrahieren, und wählen Sie eine Option aus, die Ihren Anforderungen entspricht.

Typ
barcodeFormats array of string

Geben Sie die Typen von Barcode an, die Sie identifizieren möchten.

Standort
location True string

Bereich der Seite - Verwenden Sie das Zonal-Tool, um Koordinaten zu erhalten: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Muster
regex string

Wenn hier ein regulärer Ausdruck angegeben wird, stimmen wir mit jedem extrahierten Barcode überein und geben die Übereinstimmung zurück.

Gibt zurück

Definitionen

ApiExtractPost200ApplicationJsonResponse

Name Pfad Typ Beschreibung
Fehler
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Erfolgreich
IsSuccessful boolean

Dies gibt "true" zurück, wenn mindestens eine Seite extrahiert wurde.

Lizenzinformationen
LicenceInfo string

Informationen zu Ihrem API-Abonnementschlüssel

Extrahieren von Ausgabedateien
SplittedFile array of object

Array der extrahierten Dateien

(Dateiinhalt)
SplittedFile.SplitFileContent byte

Eine Base64-Zeichenfolge, die den Dateiinhalt darstellt

(Dateiname)
SplittedFile.SplitFileName string

Eine Zeichenfolge mit dem generierten Dateinamen

(Seitenzahl)
SplittedFile.pageNumber string

Der Seitenbereich, der die Seitenzahl enthält, in der die Extraktion erfolgte

ApiGetTextValueJsonResponse

Name Pfad Typ Beschreibung
Fehlermeldung
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Erfolgreich
IsSuccessful boolean

Wenn der Text erfolgreich abgeglichen wurde

Lizenzinformationen
LicenceInfo string

Informationen zu Ihrem API-Abonnementschlüssel

Textergebnis
TextResult string

Eine Zeichenfolge, die aus dem Anwenden des extrahierten Texts auf die bereitgestellte Textergebnisvorlage generiert wird. Beachten Sie, dass die Seitenanzahl größer als eine ist, alle Seiten mithilfe des Seitentrennzeichens verkettet.

Ergebnisse
TextResults array of object

Ein Array mit einer Liste von Seiten und den extrahierten Textwerten

(Seitenzahl)
TextResults.pageNumber string

Die Seite, auf der der Text gefunden wurde

(Seitentext)
TextResults.valueExtracted string

Eine Zeichenfolge, die aus dem Anwenden des extrahierten Texts auf die bereitgestellte Textergebnisvorlage generiert wird.

(Zonenwerte)
TextResults.zoneValues array of string

Ein Array, das den aus jeder Zone extrahierten Text enthält.

ApiRenameByBarcodePost200ApplicationJsonResponse

Name Pfad Typ Beschreibung
Strichcode
BarcodeResult string

Eine Zeichenfolge, die aus dem Anwenden des extrahierten Texts auf die bereitgestellte Strichcodeergebnisvorlage generiert wird. Beachten Sie, dass die Seitenanzahl größer als eine ist, alle Seiten mithilfe des Seitentrennzeichens verkettet.

Ergebnisse
BarcodeResults array of object

Ein Array mit einer Liste von Seiten und den extrahierten Barcodewerten

(Seitenzahl)
BarcodeResults.pageNumber string

Die Seite, auf der der Barcode gefunden wurde

(Seitenstrichcode)
BarcodeResults.valueExtracted string

Eine Zeichenfolge, die aus dem Anwenden des extrahierten Barcodewerts auf die bereitgestellte Strichcodevorlage generiert wird.

(Zonenwerte)
BarcodeResults.zoneValues array of string

Ein Array, das den barcode enthält, der aus jeder Zone extrahiert wurde.

Fehlermeldung
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Erfolgreich
IsSuccessful boolean

Wenn ein Barcode erkannt wurde

Lizenzinformationen
LicenceInfo string

Informationen zu Ihrem API-Abonnementschlüssel

ApiSplitPost200ApplicationJsonResponse

Name Pfad Typ Beschreibung
Fehlermeldung
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Erfolgreich
IsSuccessful boolean

Dies gibt "true" zurück, wenn mindestens eine geteilte Seite übereinstimmen würde.

Lizenzinformationen
LicenceInfo string

Informationen zu Ihrem API-Abonnementschlüssel

Teilen von Ausgabedateien
SplittedFile array of object

Array, das jede der geteilten Dateien zusammen mit Details wie dem generierten Dateinamen und der Seitenzahl enthält.

(Dateiinhalt)
SplittedFile.SplitFileContent byte

Eine Base64-Zeichenfolge, die den Dateiinhalt darstellt

(Dateiname)
SplittedFile.SplitFileName string

Eine Zeichenfolge mit dem generierten Dateinamen

(Seitenbereich)
SplittedFile.pageNumber string

Der Seitenbereich, der die Seitenzahlen des geteilten Vorgangs enthält

GetPDFInfoResponse

Name Pfad Typ Beschreibung
Assembly zulassen
AllowAssembly boolean

Drehung, Einfügen oder Löschen von Seiten zulassen.

Herabgestuftes Drucken zulassen
AllowDegradedPrinting boolean

Ermöglichen Sie den Druck mit niedriger Qualität.

Extrahieren von Inhalten zulassen
AllowExtractContents boolean

Extraktion von Text und Grafiken zulassen.

Extrahieren für Barrierefreiheit zulassen
AllowExtractForAccessibility boolean

Ermöglichen Sie die Extraktion von Text und Grafiken zur Unterstützung der Barrierefreiheit.

Ausfüllen des Formulars zulassen
AllowFillInForm boolean

Das Ausfüllen von Formularfeldern zulassen.

Ändern von Anmerkungen zulassen
AllowModifyAnnotations boolean

Änderung von Anmerkungen zulassen.

Inhalt ändern zulassen
AllowModifyContents boolean

Änderung von Inhalten zulassen.

Drucken zulassen
AllowPrinting boolean

Hohe Druckqualität zulassen.

Autor
Author string

Wer das Dokument erstellt hat.

Erstellungsdatum
CreationDate string

Dies ist das Datum und die Uhrzeit, zu dem die PDF erstellt wurde.

Schöpfer
Creator string

Die ursprüngliche Anwendung oder Bibliothek.

Fehlermeldung
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Dateigröße (Bytes)
FileSize number

Die Größe der Datei in Byte

Hat ausgeblendeten Text
HasHiddenText boolean

Dies gibt "true" zurück, wenn die PDF-Datei über eine OCR-Ebene verfügt.

Ist verschlüsselt
IsEncrypted boolean

Dies gibt "true" zurück, wenn dieses Dokument verschlüsselt ist oder nicht.

Ist durchsuchbar
IsSearchable boolean

Dies gibt true zurück, wenn die PDF-Datei durchsuchbar ist.

Erfolgreich
IsSuccessful boolean

Gibt true zurück, wenn die Aktion erfolgreich war.

Schlüsselwörter
Keywords string

Schlüsselwörter können durch Trennzeichen getrennt werden.

Lizenzinformationen
LicenceInfo string

Json-Zusammenfassung Ihres Abonnementkontingents.

Änderungsdatum
ModifiedDate string

Diese Eigenschaft stellt das Datum und die Uhrzeit der letzten Änderung der PDF-Datei dar.

Anzahl der Seiten
NumberofPages integer

Die Anzahl der Seiten in der PDF-Datei.

PDF-Version
PDFversion number

Die Version der PDF-Spezifikation, für die das Dokument erstellt wurde.

Producer
Producer string

Das Produkt, das die PDF erstellt hat. In den frühen Tagen der PDF-Benutzer würden eine Creator-Anwendung wie Microsoft Word verwenden, um ein Dokument zu schreiben, in eine PostScript-Datei zu drucken, und dann wäre der Produzent Acrobat Distiller, die Anwendung, die die PostScript-Datei in eine PDF konvertiert hat. Heutzutage sind Creator und Producer oft dasselbe oder ein Feld bleibt leer.

Betreff
Subject string

Worum geht es beim Dokument.

Title
Title string

Der Titel des Dokuments.

Gefangen
Trapped string

Diese Eigenschaft ist ein boolescher Wert, der angibt, ob das Dokument abgefangen wurde. Trapping ist ein Vordruckprozess, der Farbbereiche in Farbtrennungen einführt, um potenzielle Registerfehler zu verdecken.

XMP-Metadaten
XmpMetadata string

Die Extensible Metadata Platform (XMP) ist ein ISO-Standard, der ursprünglich von Adobe Systems Inc. erstellt wurde, für die Erstellung, Verarbeitung und Austausch standardisierter und benutzerdefinierter Metadaten für digitale Dokumente und Datensätze.

ocr_response

Antwortdaten für OCR-Vorgang

Name Pfad Typ Beschreibung
Fehlermeldung
ErrorMessage string

Wenn der Wert "Erfolgreich" falsch ist, wird eine Fehlermeldung zurückgegeben.

Erfolgreich
IsSuccessful boolean

Gibt true zurück, wenn die OCR erfolgreich war.

Lizenzinformationen
LicenceInfo string

Informationen zu Ihrem API-Abonnementschlüssel

Protokolldateiinhalt
LogFileContent byte

Der Protokollinhalt des Vorgangs

Verarbeiteter Dateiinhalt
OutputFileContent byte

Vom Aquaforest PDF-Konverter generierte Datei.