Udostępnij przez


Aquaforest PDF

Łącznik Aquaforest PDF zawiera grupę akcji, które wykonują różne operacje PDF, takie jak dzielenie, wyodrębnianie tekstu, wyodrębnianie kodów kreskowych i operacje OCR dla usług Office 365 i Power Automate.

Ten łącznik jest dostępny w następujących produktach i regionach:

Usługa Class Regions
Copilot Studio Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Logic Apps Standard Wszystkie regiony usługi Logic Apps z wyjątkiem następujących:
     — Regiony platformy Azure Government
     — Regiony platformy Azure (Chiny)
     - Departament Obrony USA (DoD)
Power Apps Premium Wszystkie regiony usługi Power Apps z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Power Automate Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Kontakt
Name Pomoc techniczna aquaforest
adres URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email support@aquaforest.com
Metadane łącznika
Publisher Aquaforest Limited
Witryna internetowa https://www.aquaforest.com/en/aquaforest-connector.asp
Zasady ochrony prywatności https://www.aquaforest.com/en/privacy policy.pdf
Kategorie Zawartość i pliki; Dane

Łącznik Aquaforest PDF zawiera grupę akcji, które wykonują różne operacje PDF, takie jak dzielenie, wyodrębnianie tekstu, wyodrębnianie kodów kreskowych i operacje OCR dla usług Office 365 i Flow.

Wymagania wstępne

Najpierw musisz utworzyć konto interfejsu API PDF Aquaforest. To konto służy do zarządzania akcjami w formacie PDF Aquaforest i interfejsem API formatu PDF Aquaforest. Użyj aktywnego adresu e-mail, ponieważ subskrypcja zostanie połączona z tym adresem. Jeśli masz już konto, po prostu zaloguj się tutaj.

Jak uzyskać poświadczenia

  1. Zaloguj się do portalu dla deweloperów, przejdź do strony Produkty i wybierz produkt, do którego chcesz zasubskrybować.

  2. Kliknij przycisk Subskrybuj

  3. Kliknij przycisk Potwierdź , aby potwierdzić żądanie subskrypcji

  4. Klucze interfejsu API można uzyskać na stronie Profilu

Tworzenie połączenia

Łącznik obsługuje następujące typy uwierzytelniania:

Wartość domyślna Parametry tworzenia połączenia. Wszystkie regiony Nie można udostępniać

Domyślny

Dotyczy: wszystkie regiony

Parametry tworzenia połączenia.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Klucz interfejsu API securestring Klucz interfejsu API dla tego interfejsu API Prawda

Limity ograniczania

Nazwa Wywołania Okres odnowienia
Wywołania interfejsu API na połączenie 100 60 sekund

Akcje

Dzielenie pliku PDF według kodu kreskowego

Dzieli pliki PDF na podstawie dopasowań kodów kreskowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji. Ponadto narzędzie do wyodrębniania strefowego aquaforest jest dostępne pod adresem [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Plik PDF lub obrazy OCR

Wygeneruj plik PDF z możliwością wyszukiwania na podstawie pliku PDF obrazu lub zeskanowanych obrazów. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Pobieranie danych z formatu PDF

Ta akcja spowoduje wyodrębnienie ważnych danych z plików PDF w postaci par Klucz/Wartość.

Pobieranie tekstu z pliku PDF

Pobierz tekst z plików PDF na podstawie lokalizacji tekstu i wyrażeń regularnych. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Pobieranie wartości kodu kreskowego

Pobierz kod kreskowy z pliku PDF. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Pobieranie właściwości pliku PDF

Pobiera informacje o pliku PDF

Podziel plik PDF według dopasowania tekstu

Dzieli pliki PDF na podstawie dopasowań tekstowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji. Ponadto narzędzie do wyodrębniania strefowego aquaforest jest dostępne pod adresem [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Podziel plik PDF według strony

Dzieli pliki PDF na podstawie opcji podziału zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji.

Wyodrębnianie stron PDF według kodu kreskowego

Wyodrębnij pliki PDF na podstawie dopasowań kodów kreskowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Wyodrębnianie stron PDF według tekstu

Wyodrębnij pliki PDF na podstawie dopasowań tekstu zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Dzielenie pliku PDF według kodu kreskowego

Dzieli pliki PDF na podstawie dopasowań kodów kreskowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji. Ponadto narzędzie do wyodrębniania strefowego aquaforest jest dostępne pod adresem [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Szablon nazwy pliku
fileNameTemplate True string

Szablon pliku wyjściowego, jeśli znaleziono kod kreskowy

Strony bez dopasowania
noMatch string

W zależności od wybranej powyżej opcji podziału niektóre strony nie będą miały wartości kodu kreskowego. Wybierz, co należy zrobić na tych stronach.

Brak szablonu dopasowania kodu kreskowego
noTextFileName True string

Szablon pliku wyjściowego, jeśli nie znaleziono kodu kreskowego

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Opcje pliku wyjściowego
splitOption string

Użyj tej opcji, aby uściślić wyodrębnianie tekstu, wybierz opcję zgodną z wymaganiami

Typ
barcodeFormats array of string

Określ typy kodów kreskowych, które chcesz zidentyfikować

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony kod kreskowy i zwrócimy dopasowanie.

Zwraca

Plik PDF lub obrazy OCR

Wygeneruj plik PDF z możliwością wyszukiwania na podstawie pliku PDF obrazu lub zeskanowanych obrazów. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
AquaforestImageTimeout
aquaforestImageTimeout integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Author
author string

Ustaw niestandardowy autor we właściwościach wyjściowego dokumentu PDF.

Automatyczne obracanie
autorotate boolean

Automatyczne obracanie obrazu — zapewni to normalne zorientowanie całego tekstu

Binarize
binarize integer

Ta wartość powinna być ogólnie używana tylko zgodnie ze wskazówkami pomocy technicznej. Może kontrolować sposób przetwarzania obrazów kolorów i wymuszenia binaryzacji przy użyciu określonego progu. Ogólnie pokazano, że wartość 200 daje dobre wyniki w testowaniu, ale należy to potwierdzić przy użyciu "typowych" dokumentów klienta. Ustawienie tej wartości na wartość -1 jest używana metoda alternatywna, która podejmie próbę oddzielenia tekstu od dowolnych obrazów tła lub kolorów. Może to dać lepsze wyniki OCR dla niektórych dokumentów, takich jak gazety i strony magazynu.

Limit czarnych pikseli
blackPixelLimit float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Pusty próg strony
blankPageThreshold integer

Użyj tej opcji, aby ustawić minimalną liczbę "Na pikselach", która musi być obecna na obrazie, aby strona nie powinna być uważana za pustą. Wartość -1 spowoduje wyłączenie wykrywania pustej strony.

Rozmiar pola
boxSize integer

Ta opcja jest idealna w przypadku formularzy, w których czasami pola wokół tekstu mogą spowodować zidentyfikowanie obszaru jako grafiki. Ta opcja usuwa pola z tymczasowej kopii obrazu używanego przez aparat OCR. Nie usuwa pól z obrazu końcowego. Technicznie ta opcja usuwa połączone elementy z minimalnym obszarem (w pikselach i zdefiniowanym przez tę właściwość). Ta opcja jest obecnie stosowana tylko dla obrazów dwukierunkowych.

ConvertToTiff
convertToTiff boolean

Każda strona w dokumencie PDF jest rasteryzowana do obrazu TIFF.

CreateProcess
createProcess boolean

Ustaw wartość true, jeśli chcesz uruchomić proces za pomocą funkcji pinvoke.

Data utworzenia
creationDate string

Ustaw niestandardową datę utworzenia we właściwościach wyjściowego dokumentu PDF. Ciąg daty musi mieć format "rrrr-MM-dd HH:mm:ss".

Deskew
deskew boolean

Deskew (wyprostuj) obraz.

Despeckle
despeckle integer

Spowoduje to usunięcie wszystkich odłączonych elementów na obrazie o wysokości lub szerokości w pikselach mniejszych niż określona ilustracja. Wartość maksymalna to 9, a wartość domyślna to 0.

SłownikLookup
dictionaryLookup integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Dotmatrix
dotmatrix boolean

Ustaw wartość true, aby poprawić rozpoznawanie czcionek dot-matrix. Wartość domyślna to false. Jeśli ustawiono wartość true dla czcionek innych niż kropka macierzy, rozpoznawanie może być słabe.

Włączanie danych wyjściowych debugowania
enableDebugOutput boolean

Włącza dane wyjściowe debugowania.

Kompresuj plik PDF (MRC)
enableMrc boolean

Umożliwia to kompresję rasterów mieszanych, która może znacznie zmniejszyć rozmiar danych wyjściowych plików PDF obejmujących skanowania kolorów. Należy pamiętać, że ta opcja jest odpowiednia tylko wtedy, gdy źródło nie jest plikiem PDF lub użyciem funkcji ConvertToTiff.

Dane wyjściowe PDF/A
enablePDFAOutput boolean

Określa, czy dane wyjściowe mają być wyświetlane jako pliki PDF/A.

Tryb błędu
errorMode integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Zawartość pliku źródłowego
fileContent True byte

Zawartość pliku do OCR

Nazwa pliku źródłowego z rozszerzeniem
fileNameWithExtension True string

Nazwa pliku źródłowego z rozszerzeniem lub tylko rozszerzenie (z kropką wiodącą '').

Wykrywanie przerzucania
flipDetect integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Jakość skali szarości
grayscaleQuality integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Algorytmy heurystyczne
heuristics integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Jbig2EncFlags
jbig2EncFlags string

Są to flagi, które zostaną przekazane do aplikacji używanej do generowania wersji obrazów JBIG2 używanych w generowaniu plików PDF (przy założeniu, że ta kompresja jest włączona). Ta opcja powinna być ogólnie używana tylko zgodnie ze wskazówkami pomocy technicznej.

Język
language enum

Wybranie jednej z poniższych opcji powoduje ustawienie języka, który ma być używany do przetwarzania OCR. Domyślnym językiem jest angielski.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

Czasami, jeśli istnieje obraz o wartości 1bpp i ma kompresję LZW, przetwarzanie wstępne może spowodować odwrócenie koloru obrazu (czarno-biały i biały na). Ustaw wartość true, aby tego uniknąć.

Maksymalna deskew
maxDeskew float

Maksymalny kąt, za pomocą którego strona będzie deskewowana. Ta opcja powinna być ogólnie używana tylko zgodnie ze wskazówkami ze strony pomocy technicznej (support@aquaforest.com).

Minimalna pewność biurka
minDeskewConfidence float

Ta opcja powinna być ogólnie używana tylko zgodnie ze wskazówkami ze strony pomocy technicznej (support@aquaforest.com).

Data modyfikacji
modifiedDate string

Ustaw niestandardową datę modyfikacji we właściwościach wyjściowego dokumentu PDF. Ciąg daty musi mieć format "rrrr-MM-dd HH:mm:ss".

Morph
morph string

Opcje morfologiczne, które zostaną zastosowane do obrazu binarized przed OCR. Jeśli ustawiono wartość pustą, nie jest stosowana żadna. Typowe opcje obejmują te wymienione poniżej, ale aby uzyskać więcej opcji, skontaktuj się z support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Rozmiar próbkowania dla części tła obrazu. Im większa liczba, tym większy rozmiar bloków obrazów używanych do uśredniania, co spowoduje zmniejszenie rozmiaru, ale także jakości. Wartość domyślna to 3

MrcForegroundFactor
mrcForegroundFactor integer

Rozmiar próbkowania części obrazu na pierwszym planie. Im większa liczba, tym większy rozmiar bloków obrazów używanych do uśredniania, co spowoduje zmniejszenie rozmiaru, ale także jakości. Wartość domyślna to 3

MrcQuality
mrcQuality integer

Ustawienie jakości JPEG (wartość procentowa 1–100) do użycia podczas zapisywania tła i obrazów pierwszego planu. Wartość domyślna to 75

MrcTimeout
mrcTimeout integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

NoPictures
noPictures boolean

Domyślnie jeśli obszar dokumentu jest identyfikowany jako obszar graficzny, przetwarzanie OCR nie jest uruchamiane w tym obszarze. Jednak niektóre dokumenty mogą zawierać obszary lub pola, które są identyfikowane jako obszary "graficzne" lub "obraz", ale rzeczywiście zawierają przydatny tekst. Ustawienie wartości NoPictures na True spowoduje zignorowanie obszarów zidentyfikowanych jako obrazy podczas ustawiania wartości False spowoduje wymusić rozpoznawanie znaków OCR obszarów zidentyfikowanych jako obrazy.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

OcrTimeout
ocrTimeout integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Hasło
password string

Hasło do otwierania źródłowego pliku PDF

PdfToImageBpp
pdfToImageBpp enum

Bity na piksel do użycia na rasteryzowaną stronę PDF w przypadku korzystania z aparatu 1. Dotyczy to tylko dokumentów przetwarzanych przy użyciu funkcji ConvertToTiff. Wartość domyślna tej właściwości jest pobierana ze strony PDF.

PdfToImageCompression
pdfToImageCompression enum

Kompresja ustawiona na obrazy wyodrębnione lub rastrowane z każdej strony źródłowego pliku PDF. Te obrazy są następnie OCRed, aby utworzyć plik PDF z możliwością wyszukiwania. Wartość domyślna tej właściwości jest pobierana z każdej strony w źródłowym pliku PDF.

PdfToImageDpi
pdfToImageDpi enum

DPI do ustawienia na obrazy rasteryzowane z każdej strony źródłowego pliku PDF. Te obrazy są następnie OCRed, aby utworzyć plik PDF z możliwością wyszukiwania. Wartość domyślna tej właściwości jest pobierana z każdej strony w źródłowym pliku PDF.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

To ustawienie jest przydatne podczas pracy z dokumentami zawierającymi obiekty wektorowe (np. rysunki CAD). Domyślnie strony zawierające tylko obiekty wektorowe są rasteryzowane. Strony, które nie mają żadnych obrazów, ale zawierają obiekty wektorowe, a także tekst elektroniczny, są pomijane z rasteryzacji. Czasami jednak może istnieć strona zawierająca obiekty wektorowe (rysunki CAD), ale jej tytuł może znajdować się w tekście elektronicznym. Aby wymusić rasteryzowanie stron takich jak te, ustaw tę właściwość na wartość true.

PdfToImageIncludeText
pdfToImageIncludeText boolean

Po ustawieniu wartości False uniemożliwi to konwersję tekstu rzeczywistego (tj. wygenerowanego elektronicznie, w przeciwieństwie do tekstu, który jest częścią zeskanowanego obrazu) renderowania na obrazach stron wyodrębnionych z pliku PDF. Jest to spowodowane tym, że tekst jest już wyszukiwany i ogólnie nie wymaga OCR. Wartość można ustawić na Wartość True, jednak jeśli w tym rzeczywistym tekście jest wymagany identyfikator OCR.

PdfToImageMaxRes
pdfToImageMaxRes integer

Maksymalna rozdzielczość rastrowanych obrazów. Jeśli rozdzielczość pobrana ze strony PDF jest większa niż ta wartość, zostanie ustawiona na tę wartość. Wartość domyślna dla tej właściwości to 600.

PdfToImageMinRes
pdfToImageMinRes integer

Minimalna rozdzielczość rastrowanych obrazów. Jeśli rozdzielczość pobrana ze strony PDF jest niższa niż ta wartość, zostanie ustawiona na tę wartość. Wartość domyślna dla tej właściwości to 200.

Wersja pliku PDF/A
pdfaVersion enum

Wersja PLIKU PDF/A.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

RemoveBlankPage
removeBlankPage boolean

Usuń puste strony, gdy wartość BlankPageThreshold jest większa niż -1, a wartość ConvertToTiff jest prawdziwa.

Usuń linie
removeLines boolean

Usuń wiersze z obrazów, aby lepiej rozpoznać.

RestartEngineEvery
restartEngineEvery integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Zachowywanie zakładek
retainBookmarks boolean

Zachowuje wszystkie zakładki z pliku źródłowego w danych wyjściowych podczas korzystania z funkcji ConvertToTiff.

Zachowaj datę utworzenia
retainCreationDate boolean

Zachowuje datę utworzenia pliku źródłowego we właściwościach wyjściowego dokumentu PDF.

Zachowaj metadane
retainMetadata boolean

Zachowuje wszelkie metadane z pliku źródłowego w danych wyjściowych podczas korzystania z funkcji ConvertToTiff.

Zachowaj datę modyfikacji
retainModifiedDate boolean

Zachowuje zmodyfikowaną datę pliku źródłowego we właściwościach wyjściowego dokumentu PDF.

Zachowaj preferencje przeglądarki
retainViewerPreferences boolean

Zachowuje wszystkie preferencje przeglądarki PLIKÓW PDF, tryb strony i układ strony z pliku źródłowego w danych wyjściowych podczas korzystania z funkcji ConvertToTiff.

SavePredespeckle
savePredespeckle boolean

Spowoduje to użycie oryginalnego obrazu (tj. przed zastosowaniem przetwarzania wstępnego) w wyjściowym pliku PDF.

Tables
tables boolean

Ta opcja po ustawieniu wartości true próbuje ustawić wartość OCR w komórkach tabeli.

TextLayerFilterHeight
textLayerFilterHeight integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterPercentage
textLayerFilterPercentage float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterRatio
textLayerFilterRatio float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterWidth
textLayerFilterWidth integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Tryb tidy-up
tidyUpMode integer

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Weryfikowanie formatu PDF/A
validatePDFA boolean

Czy dokument PDF/A ma być weryfikowany po konwersji

Próg dopasowania programu Word
wordMatchThreshold float

Skontaktuj się z pomocą techniczną () wsupport@aquaforest.com celu uzyskania wskazówek dotyczących korzystania z tej właściwości.

Zwraca

Dane odpowiedzi dla operacji OCR

Pobieranie danych z formatu PDF

Ta akcja spowoduje wyodrębnienie ważnych danych z plików PDF w postaci par Klucz/Wartość.

Parametry

Nazwa Klucz Wymagane Typ Opis
Name
settingName True string

Wprowadź tutaj nazwę ustawienia

Wartość
settingValue True string

Wprowadź tutaj wartość ustawienia.

Współczynnik ufności
confidenceScore number

Ustaw wyższy współczynnik ufności, aby odfiltrować wartości o mniejszej pewności. Można ustawić dowolną wartość z zakresu od 0 do 1. Zalecamy rozpoczęcie od wersji 0.5

Konwersja dat
dateAsISO string

Wybierz format, w którym ma być zwracana wartość daty

Oczekiwane klucze
expectedKeys string

Podaj jedną nazwę klucza na wiersz, aby udostępnić wartości późniejszym akcjom bez analizowania kodu JSON.

Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Limit strony
pageLimit integer

Maksymalna liczba stron do przetworzenia

Zakres stron
pageRange string

Ciąg reprezentujący numery stron, które chcesz przetworzyć. Np. 1,3–4

Symbol waluty paska
stripCurrencySymbol boolean

Ustaw wartość true, jeśli chcesz, aby symbole i ciągi zostały usunięte przed zwróceniem wartości waluty

Dopasowanie synonimu
synonym boolean

Ustaw wartość true, jeśli chcesz, abyśmy zwrócili wszystkie klucze, które są synonimami oczekiwanego klucza.

Słownik synonimów
synonymDictionary string

Można podać tablicę JSON obiektów "entry", gdzie każdy obiekt zawiera listę synonimów w tablicy. Jeśli na przykład chcesz interpretować wartości "Numer faktury" i "Numer faktury" (bez uwzględniania wielkości liter) jako ten sam klucz, użyj następującego kodu JSON: [{'entry": [ "Numer faktury", "numer faktury" ]}]

Przycinanie symboli
trimSymbols boolean

Ustaw wartość true, jeśli chcesz usunąć wszystkie symbole wiodące i końcowe z odnalezionych kluczy, zanim dopasujemy je do oczekiwanego klucza.

Zwraca

Dane wyjściowe tej operacji są dynamiczne.

Pobieranie tekstu z pliku PDF

Pobierz tekst z plików PDF na podstawie lokalizacji tekstu i wyrażeń regularnych. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Brak szablonu dopasowania tekstu
noTextTemplate True string

Szablon tekstu, który ma zostać zwrócony, jeśli nie znaleziono dopasowania

Separator strony
pageSeparator string

Podaj separator strony, aby wiedzieć, gdzie znajdują się podziały stron.

Strony
pagerange string

Podaj zakres stron, z którego chcesz wyodrębnić tekst, może to być pojedynczy numer strony (1), wiele numerów stron rozdzielonych przecinkami (1,2,3), zakres stron (1–4) lub mieszanina wszystkich (1,2,4–7).

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Szablon wyników tekstowych
textResultTemplate True string

Szablon tekstu, który ma zostać zwrócony w przypadku znalezienia dopasowania

Wartość
expression array of string

Podaj w tym miejscu co najmniej jedną wartość, która ma być używana z powyższą właściwością, zwrócimy pierwszą wartość tekstną zgodną z regułą podaną powyżej.

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Strona (przestarzała)
pagenumber integer

Ta właściwość jest przestarzała. Zalecamy użycie właściwości Pages. Właściwość Pages ma zastosowanie do wszystkich stref i umożliwia wybranie stron, które chcesz przetworzyć.

Wybierz
position string

Użyj tej opcji, aby uściślić wyodrębnianie tekstu, wybierz opcję zgodną z wymaganiami

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony tekst i zwrócimy dopasowanie.

Zwraca

Pobieranie wartości kodu kreskowego

Pobierz kod kreskowy z pliku PDF. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
Szablon wyniku kodu kreskowego
barcodeResultTemplate True string

Szablon wyniku tekstu wyjściowego, jeśli zostanie znaleziony kod kreskowy

Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Brak szablonu kodu kreskowego
noBarcodeTemplate True string

Szablon wyniku tekstu wyjściowego, jeśli nie znaleziono kodu kreskowego

Separator strony
pageSeparator string

Podaj separator strony, aby wiedzieć, gdzie znajdują się podziały stron.

Strony
pagerange string

Podaj zakres stron, z którego chcesz wyodrębnić tekst, może to być pojedynczy numer strony (1), wiele numerów stron rozdzielonych przecinkami (1,2,3), zakres stron (1–4) lub mieszanina wszystkich (1,2,4–7).

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Typ
barcodeFormats array of string

Określ typy kodów kreskowych, które chcesz zidentyfikować

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Strona (przestarzała)
pagenumber integer

Ta właściwość jest przestarzała. Zalecamy użycie właściwości Pages. Właściwość Pages ma zastosowanie do wszystkich stref i umożliwia wybranie stron, które chcesz przetworzyć.

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony tekst i zwrócimy dopasowanie.

Zwraca

Pobieranie właściwości pliku PDF

Pobiera informacje o pliku PDF

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Limit strony
pageLimit integer

Maksymalna liczba stron do przetworzenia. Służy to tylko do sprawdzania, czy strony zawierają ukryty tekst lub czy plik PDF można przeszukiwać

Zwraca

Podziel plik PDF według dopasowania tekstu

Dzieli pliki PDF na podstawie dopasowań tekstowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji. Ponadto narzędzie do wyodrębniania strefowego aquaforest jest dostępne pod adresem [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Szablon nazwy pliku
fileNameTemplate True string

Szablon pliku wyjściowego, jeśli znaleziono dopasowania tekstowe

Strony bez dopasowania
noMatch string

W zależności od wybranej powyżej opcji podziału niektóre strony nie będą miały wyodrębnionej wartości tekstowej. Wybierz, co należy zrobić na tych stronach.

Brak szablonu pliku
noTextFileName True string

Szablon pliku wyjściowego, jeśli nie znaleziono dopasowania tekstu

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Opcje pliku wyjściowego
splitOption string

Wybierz lokalizację strony z kodem kreskowym w plikach wyjściowych z operacji podziału.

Wartość
expression array of string

Podaj w tym miejscu co najmniej jedną wartość, która ma być używana z powyższą właściwością, zwrócimy pierwszą wartość tekstną zgodną z regułą podaną powyżej.

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Wybierz
position string

Użyj tej opcji, aby uściślić wyodrębnianie tekstu, wybierz opcję zgodną z wymaganiami

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony tekst i zwrócimy dopasowanie.

Zwraca

Podziel plik PDF według strony

Dzieli pliki PDF na podstawie opcji podziału zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] w celu uzyskania dokumentacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego.

Nazwa pliku wyjściowego
fileNameTemplate True string

Docelowy szablon pliku, który może zawierać %UNIQUEn (unikatowa liczba rozpoczynająca się od 1, zero do n cyfr) i %FILENAME (oryginalna nazwa pliku bez rozszerzenia).

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego.

Typ podziału
splitOption True string

Wybierz operację dzielenia, która ma być używana dla każdego pliku.

Zakres stron
pageRange string

Zestaw zakresów stron rozdzielonych przecinkami definiującymi, które strony z oryginału powinny zostać wyodrębnione.

Powtarzaj co
repeatEvery integer

Zastosuj zakres stron do każdego zestawu stron Zakresy stron w dokumencie. Jeśli na przykład dla zakresów stron określono wartość 2–4, a 4 jest określony jako powtarzający się zakres, zakres jest ponownie stosowany co 4 strony.

Zachowywanie zakładek
retainBookmarks boolean

Wygenerowane pliki będą zawierać zakładki z oryginalnego pliku.

Zachowaj metadane
retainMetadata boolean

Wygenerowane pliki będą zawierać metadane (takie jak Autor i Tytuł) z oryginalnego pliku.

Zwraca

Wyodrębnianie stron PDF według kodu kreskowego

Wyodrębnij pliki PDF na podstawie dopasowań kodów kreskowych zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Szablon nazwy pliku
fileNameTemplate True string

Szablon pliku wyjściowego, jeśli znaleziono kod kreskowy

Brak szablonu pliku
noTextFileName True string

Szablon pliku wyjściowego, jeśli nie znaleziono kodu kreskowego

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Typ
barcodeFormats array of string

Określ typy kodów kreskowych, które chcesz zidentyfikować

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony kod kreskowy i zwrócimy dopasowanie.

Zwraca

Wyodrębnianie stron PDF według tekstu

Wyodrębnij pliki PDF na podstawie dopasowań tekstu zdefiniowanych przez użytkownika. Odwiedź stronę [https://www.aquaforest.com/en/aquaforest-flow-doc.asp], aby uzyskać więcej informacji.

Parametry

Nazwa Klucz Wymagane Typ Opis
Zawartość pliku
fileContent True byte

Zawartość pliku źródłowego

Szablon nazwy pliku
fileNameTemplate True string

Szablon pliku wyjściowego, jeśli znaleziono dopasowania tekstowe

Brak szablonu pliku
noTextFileName True string

Szablon pliku wyjściowego, jeśli nie znaleziono dopasowania tekstu

Nazwa pliku
sourceFileName True string

Nazwa pliku źródłowego

Wartość
expression array of string

Podaj w tym miejscu co najmniej jedną wartość, która ma być używana z powyższą właściwością, zwrócimy pierwszą wartość tekstną zgodną z regułą podaną powyżej.

Lokalizacja
location True string

Obszar strony — użyj narzędzia strefowego, aby uzyskać współrzędne: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Wybierz
position string

Użyj tej opcji, aby uściślić wyodrębnianie tekstu, wybierz opcję zgodną z wymaganiami

Wzór
regex string

Jeśli w tym miejscu zostanie podane wyrażenie regularne, dopasujemy do niego dowolny wyodrębniony tekst i zwrócimy dopasowanie.

Zwraca

Definicje

ApiExtractPost200ApplicationJsonResponse

Nazwa Ścieżka Typ Opis
Error
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Powodzenie
IsSuccessful boolean

Spowoduje to zwrócenie wartości true, jeśli wyodrębniono co najmniej jedną stronę

Informacje o licencji
LicenceInfo string

Informacje o kluczu subskrypcji interfejsu API

Wyodrębnianie plików wyjściowych
SplittedFile array of object

Tablica wyodrębnionych plików

(Zawartość pliku)
SplittedFile.SplitFileContent byte

Podstawowy ciąg 64 reprezentujący zawartość pliku

(Nazwa pliku)
SplittedFile.SplitFileName string

Ciąg zawierający wygenerowaną nazwę pliku

(Numer strony)
SplittedFile.pageNumber string

Zakres stron zawierający numer strony, w którym wystąpił wyodrębnianie

ApiGetTextValueJsonResponse

Nazwa Ścieżka Typ Opis
Komunikat o błędzie
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Powodzenie
IsSuccessful boolean

Jeśli tekst został pomyślnie dopasowany

Informacje o licencji
LicenceInfo string

Informacje o kluczu subskrypcji interfejsu API

Wynik tekstowy
TextResult string

Ciąg wygenerowany na podstawie zastosowania wyodrębnionego tekstu do udostępnionego szablonu wyników tekstu. Pamiętaj, że jeśli liczba stron jest większa niż jedna, połączy wszystkie strony przy użyciu separatora strony.

Results
TextResults array of object

Tablica zawierająca listę stron i wyodrębnione wartości tekstowe

(Numer strony)
TextResults.pageNumber string

Strona, na której znaleziono tekst

(Tekst strony)
TextResults.valueExtracted string

Ciąg wygenerowany na podstawie zastosowania wyodrębnionego tekstu do udostępnionego szablonu wyników tekstu.

(Wartości strefy)
TextResults.zoneValues array of string

Tablica zawierająca tekst wyodrębniony z każdej strefy.

ApiRenameByBarcodePost200ApplicationJsonResponse

Nazwa Ścieżka Typ Opis
Kod kreskowy
BarcodeResult string

Ciąg wygenerowany z zastosowania wyodrębnionego tekstu do dostarczonego szablonu wyniku kodu kreskowego. Pamiętaj, że jeśli liczba stron jest większa niż jedna, połączy wszystkie strony przy użyciu separatora strony.

Results
BarcodeResults array of object

Tablica zawierająca listę stron i wyodrębnione wartości kodu kreskowego

(Numer strony)
BarcodeResults.pageNumber string

Strona, na której znaleziono kod kreskowy

(Kod kreskowy strony)
BarcodeResults.valueExtracted string

Ciąg wygenerowany z zastosowania wyodrębnionej wartości kodu kreskowego do dostarczonego szablonu wyniku kodu kreskowego.

(Wartości strefy)
BarcodeResults.zoneValues array of string

Tablica zawierająca kod kreskowy wyodrębniony z każdej strefy.

Komunikat o błędzie
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Powodzenie
IsSuccessful boolean

Jeśli wykryto kod kreskowy

Informacje o licencji
LicenceInfo string

Informacje o kluczu subskrypcji interfejsu API

ApiSplitPost200ApplicationJsonResponse

Nazwa Ścieżka Typ Opis
Komunikat o błędzie
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Powodzenie
IsSuccessful boolean

Spowoduje to zwrócenie wartości true w przypadku dopasowania co najmniej jednej strony podziału.

Informacje o licencji
LicenceInfo string

Informacje o kluczu subskrypcji interfejsu API

Dzielenie plików wyjściowych
SplittedFile array of object

Tablica zawierająca każdy z podzielonych plików wraz ze szczegółami, takimi jak wygenerowana nazwa pliku i numer strony.

(Zawartość pliku)
SplittedFile.SplitFileContent byte

Podstawowy ciąg 64 reprezentujący zawartość pliku

(Nazwa pliku)
SplittedFile.SplitFileName string

Ciąg zawierający wygenerowaną nazwę pliku

(Zakres stron)
SplittedFile.pageNumber string

Zakres stron zawierający numery stron operacji podziału

GetPDFInfoResponse

Nazwa Ścieżka Typ Opis
Zezwalaj na zestaw
AllowAssembly boolean

Zezwalaj na rotację, wstawianie lub usuwanie stron.

Zezwalaj na obniżoną wydajność drukowania
AllowDegradedPrinting boolean

Zezwalaj na drukowanie o niskiej jakości.

Zezwalaj na wyodrębnianie zawartości
AllowExtractContents boolean

Zezwalaj na wyodrębnianie tekstu i grafiki.

Zezwalaj na wyodrębnianie dla ułatwień dostępu
AllowExtractForAccessibility boolean

Zezwalaj na wyodrębnianie tekstu i grafiki w celu zapewnienia ułatwień dostępu.

Zezwalaj na wypełnianie formularza
AllowFillInForm boolean

Zezwalaj na wypełnianie pól formularza.

Zezwalaj na modyfikowanie adnotacji
AllowModifyAnnotations boolean

Zezwalaj na modyfikowanie adnotacji.

Zezwalaj na modyfikowanie zawartości
AllowModifyContents boolean

Zezwalaj na modyfikowanie zawartości.

Zezwalaj na drukowanie
AllowPrinting boolean

Zezwalaj na drukowanie wysokiej jakości.

Author
Author string

Kto utworzył dokument.

Data utworzenia
CreationDate string

Jest to data i godzina utworzenia pliku PDF.

Kreator
Creator string

Aplikacja lub biblioteka źródłowa.

Komunikat o błędzie
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Rozmiar pliku (bajty)
FileSize number

Rozmiar pliku w bajtach

Ma ukryty tekst
HasHiddenText boolean

Spowoduje to zwrócenie wartości true, jeśli plik PDF ma warstwę OCR.

Is Encrypted
IsEncrypted boolean

Spowoduje to zwrócenie wartości true, jeśli ten dokument jest zaszyfrowany lub nie.

Czy można wyszukiwać
IsSearchable boolean

Spowoduje to zwrócenie wartości true, jeśli plik PDF można przeszukiwać.

Powodzenie
IsSuccessful boolean

Zwraca wartość true, jeśli akcja zakończyła się pomyślnie.

Słowa kluczowe
Keywords string

Słowa kluczowe mogą być rozdzielone przecinkami.

Informacje o licencji
LicenceInfo string

Podsumowanie limitu przydziału subskrypcji w formacie JSON.

Data modyfikacji
ModifiedDate string

Ta właściwość reprezentuje datę i godzinę ostatniej modyfikacji pliku PDF

Liczba stron
NumberofPages integer

Liczba stron w pliku PDF.

Wersja pliku PDF
PDFversion number

Wersja specyfikacji pliku PDF, dla którego został skompilowany dokument.

Producer
Producer string

Produkt, który utworzył plik PDF. We wczesnych dniach plików PDF osoby korzystające z aplikacji Creator, takiej jak Microsoft Word, będą pisać dokument, drukować go do pliku PostScript, a następnie producent to Acrobat Distiller, aplikacja, która przekonwertowała plik PostScript na plik PDF. Obecnie twórca i producent są często takie same lub jedno pole pozostaje puste.

Temat
Subject string

O czym chodzi w dokumencie.

Title
Title string

Tytuł dokumentu.

Uwięziony
Trapped string

Ta właściwość jest wartością logiczną wskazującą, czy dokument został uwięziony. Podlewka jest procesem wstępnego prasy, który wprowadza obszary kolorów do separacji kolorów w celu zasłaniania potencjalnych błędów rejestru.

Metadane XMP
XmpMetadata string

Extensible Metadata Platform (XMP) to standard ISO, pierwotnie utworzony przez firmę Adobe Systems Inc., do tworzenia, przetwarzania i wymiany ustandaryzowanych i niestandardowych metadanych dla dokumentów cyfrowych i zestawów danych.

ocr_response

Dane odpowiedzi dla operacji OCR

Nazwa Ścieżka Typ Opis
Komunikat o błędzie
ErrorMessage string

Jeśli wartość Is Successful ma wartość false, zostanie zwrócony komunikat o błędzie

Powodzenie
IsSuccessful boolean

Zwraca wartość true, jeśli rekord OCR zakończył się pomyślnie.

Informacje o licencji
LicenceInfo string

Informacje o kluczu subskrypcji interfejsu API

Zawartość pliku dziennika
LogFileContent byte

Zawartość dziennika operacji

Przetworzona zawartość pliku
OutputFileContent byte

Plik wygenerowany przez konwerter PDF Aquaforest.