共用方式為


水產森林 PDF

Aquaforest PDF 連接器包含一組動作,可執行不同的 PDF 操作,例如 Office 365 和 Power Automate 的分割、文字擷取、條碼擷取和 OCR 作業。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
邏輯應用程式 標準 所有 Logic Apps 區域, 但下列區域除外:
     - Azure Government 區域
     - Azure 中國區域
     - 美國國防部 (DoD)
Power Apps 進階 除下列區域外的所有 Power Apps 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
Power Automate(自動化服務) 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
連絡人​​
名稱 水產森林支持
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email support@aquaforest.com
連接器中繼資料
Publisher 水產森林有限公司
網站 https://www.aquaforest.com/en/aquaforest-connector.asp
隱私策略 https://www.aquaforest.com/en/privacy policy.pdf
類別 內容和文件;資料

Aquaforest PDF 連接器包含一組動作,可執行不同的 PDF 操作,例如 Office 365 和 Flow 的分割、文字擷取、條碼擷取和 OCR 作業。

先決條件

首先,您需要創建一個 Aquaforest PDF API 帳戶。 此帳戶用於管理 Aquaforest PDF Actions 和 Aquaforest PDF API。 請使用您的有效電子郵件地址,因為訂閱將連結到此地址。 如果您已經有帳戶,只需 在此處登錄即可。

如何取得認證

  1. 登入 開發者入口網站,前往 產品 頁面,選擇您要訂閱的產品。

  2. 按一下「 訂閱 」按鈕

  3. 按一下 「確認」 按鈕以確認您的訂閱要求

  4. 您可以在「設定檔」頁面中存取您的 API 金鑰

正在建立連線

連接器支援下列驗證類型:

預設值 建立連線的參數。 所有區域 不可共享

預設

適用:所有地區

建立連線的參數。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
API 金鑰 securestring 此 API 的 API 金鑰

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 100 60 秒

動作

OCR PDF 或圖像

從圖像 PDF 或掃描圖像生成可搜索的 PDF。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

取得 PDF 屬性

取得有關 PDF 檔案的資訊

取得條碼值

從 PDF 獲取條形碼。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

從 PDF 取得文字

根據文本位置和正則表達式從 PDF 文件中獲取文本。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

從 PDF 取得資料

此操作將以鍵/值對的形式從PDF文件中提取重要數據。

按文本匹配拆分 PDF

根據使用者定義的文字相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

按文本提取 PDF 頁面

根據使用者定義的文字相符擷取 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

按條形碼分割 PDF

根據使用者定義的條碼相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

按頁面分割 PDF

根據使用者定義的分割選項分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。

通過條形碼提取 PDF 頁面

根據用戶定義的條形碼匹配提取 PDF 文件。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

OCR PDF 或圖像

從圖像 PDF 或掃描圖像生成可搜索的 PDF。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱 機碼 必要 類型 Description
AquaforestImageTimeout
aquaforestImageTimeout integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

作者
author string

在輸出PDF檔案屬性中設定自訂作者。

自動旋轉
autorotate boolean

自動旋轉圖像 – 這將確保所有文本正常導向

二值化
binarize integer

此值通常只能在技術支援的指導下使用。 它可以控制彩色影像的處理方式,並強制使用特定閾值進行二值化。 200 的值已被證明通常在測試中提供良好的結果,但這應該通過“典型”客戶文檔來確認。 透過將此設定為 -1 使用替代方法,該方法將嘗試將文字與任何背景圖像或顏色分開。 這可以改善某些文件(例如報紙和雜誌頁面)的 OCR 結果。

黑色像素限制
blackPixelLimit float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

空白頁臨界值
blankPageThreshold integer

使用此選項可設定影像中必須存在的「像素上」的最小數量,頁面才不會被視為空白。 值為 -1 將關閉空白頁偵測。

盒子尺寸
boxSize integer

此選項非常適合表單,其中文字周圍的方塊有時會導致某個區域被識別為圖形。 此選項會從 OCR 引擎使用的影像暫存副本中移除方塊。 它不會從最終圖像中刪除框。 從技術上講,此選項會移除具有最小面積 (以像素為單位,並由此屬性定義) 的連接元素。 此選項目前僅適用於雙色調影像。

轉換為 Tiff
convertToTiff boolean

PDF 文件中的每一頁都會點陣化為 TIFF 影像。

CreateProcess
createProcess boolean

如果您想通過 pinvoke 啟動進程,請將此設置為 true。

建立日期
creationDate string

在輸出 PDF 文件屬性中設定自訂建立日期。 日期字串的格式必須為 'yyyy-MM-dd HH:mm:ss'。

歪斜校正
deskew boolean

傾斜(拉直)影像。

去斑點
despeckle integer

這會移除影像中高度或寬度小於指定圖形的所有斷開連接的元素(以像素為單位)。 最大值為 9,預設值為 0。

字典查閱
dictionaryLookup integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

點陣
dotmatrix boolean

將此設定為 true 以改善點陣字型的辨識。 預設值為 False。 如果針對非點陣字型設定為 true,則辨識效果可能會很差。

啟用偵錯輸出
enableDebugOutput boolean

啟用偵錯輸出。

壓縮 PDF (MRC)
enableMrc boolean

這啟用了混合光柵壓縮,可以顯著減少包含彩色掃描的 PDF 的輸出大小。 請注意,此選項僅適用於來源不是 PDF 或使用 ConvertToTiff 的情況。

PDF/A 輸出
enablePDFAOutput boolean

是否輸出為 PDF/A。

錯誤模式
errorMode integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

來源檔案內容
fileContent True byte

OCR 的檔案內容

具有副檔名的來源檔案名稱
fileNameWithExtension True string

具有副檔名或僅副檔名的來源檔案名稱 (具有前導句點 '.')

翻轉偵測
flipDetect integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

灰階品質
grayscaleQuality integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

啟發學習法
heuristics integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

Jbig2Enc旗標
jbig2EncFlags string

這些標誌將傳遞給用於產生 PDF 產生中使用的影像的 JBIG2 版本的應用程式(假設已啟用此壓縮)。 此選項通常只能在技術支援的指導下使用。

語言
language enum

選擇以下選項之一會設定要用於 OCR 處理的語言。 預設語言為英文。

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

有時,如果影像為 1bpp 且具有 LZW 壓縮,則預處理可能會導致影像的顏色反轉(黑變白、白變黑)。 將此設定為 true 以避免這種情況。

最大傾斜校正
maxDeskew float

頁面傾斜的最大角度。 此選項通常只能在技術支援 ()support@aquaforest.com 的指導下使用。

最小偏斜偏移置信度
minDeskewConfidence float

此選項通常只能在技術支援 ()support@aquaforest.com 的指導下使用。

修改日期
modifiedDate string

在輸出 PDF 文件屬性中設定自訂修改日期。 日期字串的格式必須為 'yyyy-MM-dd HH:mm:ss'。

變形
morph string

在 OCR 之前將應用於二值化圖像的形態選項。 如果設定為空白,則不會套用任何內容。 常見選項包括下面列出的選項,但如需更多選項,請聯繫 support@aquaforest.com。

Mrc背景因素
mrcBackgroundFactor integer

影像背景部分的取樣大小。 數字越高,用於平均的圖像塊的大小越大,這將導致尺寸減小,但質量也會減小。 預設值為 3

MrcForeground因素
mrcForegroundFactor integer

影像前景部分的取樣大小。 數字越高,用於平均的圖像塊的大小越大,這將導致尺寸減小,但質量也會減小。 預設值為 3

MrcQuality 先生
mrcQuality integer

JPEG 品質設定(百分比值 1 - 100)用於儲存背景和前景影像。 預設值為 75

MrcTimeout
mrcTimeout integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

無圖片
noPictures boolean

依預設,如果文件的某個區域被識別為圖形區域,則不會在該區域上執行 OCR 處理。 但是,某些文檔可能包含被識別為“圖形”或“圖片”區域但實際上包含有用文本的區域或框。 將 NoPictures 設定為 True 將導致它忽略識別為圖片的區域,而將其設定為 False 將強制識別為圖片的區域的 OCR。

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

OcrTimeout
ocrTimeout integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

密碼
password string

開啟來源 PDF 檔案的密碼

PdfToImageBpp
pdfToImageBpp enum

使用引擎 1 時用於點陣化 PDF 頁面的每像素位數。 這僅適用於使用 ConvertToTiff 處理的文件。 此屬性的預設值取自 PDF 頁面。

PdfToImage壓縮
pdfToImageCompression enum

要設定為從來源 PDF 檔案的每一頁擷取或點陣化的影像的壓縮。 然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。 此屬性的預設值取自來源 PDF 檔案中的每個頁面。

PdfToImageDpi
pdfToImageDpi enum

要設定為從來源 PDF 檔案的每一頁點陣化的影像的 DPI。 然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。 此屬性的預設值取自來源 PDF 檔案中的每個頁面。

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

當處理包含向量物件 (例如 CAD 圖紙) 的文件時,此設定非常有用。 依預設,只會包含向量物件的頁面會點陣化。 沒有任何影像但包含向量物件和電子文字的頁面會從點陣化中略過。 但是,有時可能有一個頁面包含向量物件 (CAD 圖紙),但其標題可能是電子文字。 若要強制點陣化頁面,請將此屬性設定為 true。

PdfToImageIncludeText
pdfToImageIncludeText boolean

當設定為 False 時,這將防止在從 PDF 擷取的頁面影像中轉譯真實文字 (即以電子方式產生,而不是掃描影像一部分的文字)。 這是因為文本已經可以搜索,因此通常不需要 OCR。 不過,如果此實際文字需要 OCR,則可以將值設定為 True。

PdfToImageMaxRes
pdfToImageMaxRes integer

點陣化影像的最大解析度。 如果從 PDF 頁面擷取的解析度大於此值,則會設定為此值。 此屬性的預設值為 600。

PdfToImageMinRes
pdfToImageMinRes integer

點陣化影像的最小解析度。 如果從 PDF 頁面擷取的解析度低於此值,則會設定為此值。 此屬性的預設值為 200。

PDF/A 版本
pdfaVersion enum

PDF/A 版本。

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

移除空白頁
removeBlankPage boolean

當 BlankPageThreshold 大於 -1 且 ConvertToTiff 為 true 時,移除空白頁面。

移除行
removeLines boolean

從圖像中刪除線條以獲得更好的識別。

重新啟動引擎每個
restartEngineEvery integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

保留書籤
retainBookmarks boolean

使用 ConvertToTiff 時,會在輸出中保留來源檔案中的任何書籤。

保留建立日期
retainCreationDate boolean

在輸出 PDF 文件屬性中保留來源檔案的建立日期。

保留中繼資料
retainMetadata boolean

使用 ConvertToTiff 時,會在輸出中保留來源檔案中的任何中繼資料。

保留修改日期
retainModifiedDate boolean

在輸出 PDF 文件屬性中保留來源檔案的修改日期。

保留檢視者偏好設定
retainViewerPreferences boolean

使用 ConvertToTiff 時,在輸出中保留來源檔案中的任何 PDF 檢視器偏好設定、頁面模式和頁面佈局。

SavePredespeckle
savePredespeckle boolean

這將在輸出 PDF 中使用原始影像 (即在套用預處理之前)。

Tables
tables boolean

當此選項設定為 true 時,會嘗試在表格儲存格內進行 OCR。

TextLayerFilterHeight
textLayerFilterHeight integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterPercentage
textLayerFilterPercentage float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterRatio
textLayerFilterRatio float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterRatio反轉
textLayerFilterRatioInverted float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterWidth
textLayerFilterWidth integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

TextLayerMaxBoxes
textLayerMaxBoxes integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

整理模式
tidyUpMode integer

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

驗證 PDF/A
validatePDFA boolean

轉換後是否驗證 PDF/A 文件

單字比對閾值
wordMatchThreshold float

請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。

傳回

OCR 操作的回應資料

身體
ocr_response

取得 PDF 屬性

取得有關 PDF 檔案的資訊

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

頁面限制
pageLimit integer

要處理的最大頁數,這僅用於檢查頁面是否包含隱藏文本或檢查 PDF 是否可搜索

傳回

取得條碼值

從 PDF 獲取條形碼。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱 機碼 必要 類型 Description
條碼結果範本
barcodeResultTemplate True string

如果找到條碼,則輸出文字結果的範本

檔案內容
fileContent True byte

來源檔案的內容

無條碼模板
noBarcodeTemplate True string

如果找不到條碼,則輸出文字結果的範本

分隔符號
pageSeparator string

提供分頁符號,以便您可以知道分頁符號的位置。

頁面
pagerange string

提供您要從中提取文本的頁面範圍,可以是單個頁碼 (1)、以逗號分隔的多個頁碼 (1,2,3)、一個頁面範圍 (1-4) 或所有頁面範圍的混合 (1,2,4-7)。

檔案名稱
sourceFileName True string

來源檔案的名稱

類型
barcodeFormats array of string

指定您要識別的條碼類型

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

頁面 (已棄用)
pagenumber integer

此屬性已淘汰,建議您使用 Pages 屬性。 頁面屬性會套用至所有區域,並可讓您選取要處理的頁面。

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

從 PDF 取得文字

根據文本位置和正則表達式從 PDF 文件中獲取文本。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

無文字比對範本
noTextTemplate True string

找不到相符專案時要傳回的文字範本

分隔符號
pageSeparator string

提供分頁符號,以便您可以知道分頁符號的位置。

頁面
pagerange string

提供您要從中提取文本的頁面範圍,可以是單個頁碼 (1)、以逗號分隔的多個頁碼 (1,2,3)、一個頁面範圍 (1-4) 或所有頁面範圍的混合 (1,2,4-7)。

檔案名稱
sourceFileName True string

來源檔案的名稱

文字結果範本
textResultTemplate True string

找到相符專案時要傳回的文字範本

價值觀
expression array of string

在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

頁面 (已棄用)
pagenumber integer

此屬性已淘汰,建議您使用 Pages 屬性。 頁面屬性會套用至所有區域,並可讓您選取要處理的頁面。

選擇
position string

使用它來優化您提取的更多文本,選擇符合您要求的選項

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

從 PDF 取得資料

此操作將以鍵/值對的形式從PDF文件中提取重要數據。

參數

名稱 機碼 必要 類型 Description
名稱
settingName True string

在此處輸入設定名稱

價值觀
settingValue True string

在此處輸入設定值。

信賴分數
confidenceScore number

設定較高的信賴分數,以篩選出信賴度較低的值。 您可以設定介於 0 和 1 之間的任何值。 我們建議從 0.5 開始

日期轉換
dateAsISO string

選取要傳回日期值的格式

預期索引鍵
expectedKeys string

每行提供一個索引鍵名稱,讓值可供稍後的動作使用,而無需剖析 JSON。

檔案內容
fileContent True byte

來源檔案的內容

頁面限制
pageLimit integer

要處理的頁數上限

頁面範圍
pageRange string

您要處理的頁碼的字串表示法。 例如 1,3-4

條形貨幣符號
stripCurrencySymbol boolean

如果您希望在傳回貨幣值之前刪除符號和字串,請將此設定為 true

比對同義詞
synonym boolean

如果您希望我們傳回與預期索引鍵同義字的所有索引鍵,請將此設定為 true。

同義詞詞典
synonymDictionary string

您可以提供「入口」物件的 JSON 陣列,其中每個物件都包含陣列中的同義字清單。 例如,如果您希望將「發票號碼」和「發票號碼」(不區分大小寫)解譯為相同的索引鍵,請使用下列 JSON:[{'entry': [ '發票號碼', '發票號碼' ]}]

修剪符號
trimSymbols boolean

如果您希望我們在找到的鍵中刪除所有前導和尾端符號,然後再將它們與預期的鍵匹配,請將此值設置為 true。

傳回

此作業會輸出隨機的結果。

按文本匹配拆分 PDF

根據使用者定義的文字相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

檔案名稱範本
fileNameTemplate True string

如果找到文字相符,則輸出檔案的範本

沒有相符的頁面
noMatch string

根據您在上面選擇的分割選項,某些頁面將不會提取文字值。 選擇要在這些頁面上執行的動作。

無檔案範本
noTextFileName True string

輸出檔案的範本(如果找不到文字相符項)

檔案名稱
sourceFileName True string

來源檔案的名稱

輸出檔案選項
splitOption string

從分割操作的輸出檔案中選擇帶有條碼的頁面位置。

價值觀
expression array of string

在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

選擇
position string

使用它來優化您提取的更多文本,選擇符合您要求的選項

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

按文本提取 PDF 頁面

根據使用者定義的文字相符擷取 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

檔案名稱範本
fileNameTemplate True string

如果找到文字相符,則輸出檔案的範本

無檔案範本
noTextFileName True string

輸出檔案的範本(如果找不到文字相符項)

檔案名稱
sourceFileName True string

來源檔案的名稱

價值觀
expression array of string

在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

選擇
position string

使用它來優化您提取的更多文本,選擇符合您要求的選項

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

按條形碼分割 PDF

根據使用者定義的條碼相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

檔案名稱範本
fileNameTemplate True string

如果找到條碼,則輸出檔案的範本

沒有相符的頁面
noMatch string

根據您在上面選擇的分割選項,某些頁面將沒有條碼值。 選擇要在這些頁面上執行的動作。

無條碼匹配模板
noTextFileName True string

輸出檔案的範本(如果找不到條碼)

檔案名稱
sourceFileName True string

來源檔案的名稱

輸出檔案選項
splitOption string

使用它來優化您提取的更多文本,選擇符合您要求的選項

類型
barcodeFormats array of string

指定您要識別的條碼類型

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的條形碼與其進行匹配並返回匹配項。

傳回

按頁面分割 PDF

根據使用者定義的分割選項分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容。

輸出檔案名稱
fileNameTemplate True string

目標檔案範本,可包含 %UNIQUEn (唯一編號從 1 開始,零填充至 n 位數) 和 %FILENAME (不含副檔名的原始檔案名稱)。

檔案名稱
sourceFileName True string

來源檔案的名稱。

分割類型
splitOption True string

選擇要用於每個檔案的分割作業。

頁面範圍
pageRange string

以逗號分隔的頁面範圍集,定義應從原始頁面擷取哪些頁面。

重複每一次
repeatEvery integer

將頁面範圍套用至文件內的每一組「頁面範圍」頁面。 例如,如果為頁面範圍指定 2-4,並將 4 指定為重複範圍,則每 4 頁重新套用一次範圍。

保留書籤
retainBookmarks boolean

產生的檔案將包含原始檔案中的書籤。

保留中繼資料
retainMetadata boolean

產生的檔案將包含原始檔案的中繼資料(例如作者和標題)。

傳回

通過條形碼提取 PDF 頁面

根據用戶定義的條形碼匹配提取 PDF 文件。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱 機碼 必要 類型 Description
檔案內容
fileContent True byte

來源檔案的內容

檔案名稱範本
fileNameTemplate True string

如果找到條碼,則輸出檔案的範本

無檔案範本
noTextFileName True string

輸出檔案的範本(如果找不到條碼)

檔案名稱
sourceFileName True string

來源檔案的名稱

類型
barcodeFormats array of string

指定您要識別的條碼類型

地點
location True string

頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html]

樣式
regex string

如果此處提供了正則表達式,我們會將任何提取的條形碼與其進行匹配並返回匹配項。

傳回

定義

ApiExtractPost200ApplicationJson回應

名稱 路徑 類型 Description
錯誤
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

成功
IsSuccessful boolean

如果至少擷取了一個頁面,則會傳回 true

授權資訊
LicenceInfo string

API 訂閱金鑰的相關資訊

提取輸出文件
SplittedFile array of object

提取的檔案陣列

(檔案內容)
SplittedFile.SplitFileContent byte

代表檔案內容的基數 64 字串

(檔案名稱)
SplittedFile.SplitFileName string

包含所產生檔案名稱的字串

(頁碼)
SplittedFile.pageNumber string

包含擷取發生的頁碼的頁面範圍

ApiGetTextValueJson回應

名稱 路徑 類型 Description
錯誤訊息
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

成功
IsSuccessful boolean

如果文字已成功匹配

授權資訊
LicenceInfo string

API 訂閱金鑰的相關資訊

文字結果
TextResult string

將擷取的文字套用至提供的文字結果範本所產生的字串。 請注意,如果頁面計數大於 1,則會使用頁面分隔符號串連所有頁面。

Results
TextResults array of object

包含頁面清單和擷取的文字值的陣列

(頁碼)
TextResults.pageNumber string

找到文字的頁面

(頁面正文)
TextResults.valueExtracted string

將擷取的文字套用至提供的文字結果範本所產生的字串。

(區域值)
TextResults.zoneValues array of string

包含從每個區域擷取的文字的陣列。

ApiRenameByBarcodePost200ApplicationJsonResponse

名稱 路徑 類型 Description
條碼
BarcodeResult string

將擷取的文字套用至提供的條碼結果範本所產生的字串。 請注意,如果頁面計數大於 1,則會使用頁面分隔符號串連所有頁面。

Results
BarcodeResults array of object

包含頁面清單和擷取的條碼值的陣列

(頁碼)
BarcodeResults.pageNumber string

找到條碼的頁面

(頁面條碼)
BarcodeResults.valueExtracted string

將擷取的條碼值套用至提供的條碼結果範本所產生的字串。

(區域值)
BarcodeResults.zoneValues array of string

包含從每個區域提取的條碼的陣列。

錯誤訊息
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

成功
IsSuccessful boolean

如果偵測到條碼

授權資訊
LicenceInfo string

API 訂閱金鑰的相關資訊

ApiSplitPost200ApplicationJson回應

名稱 路徑 類型 Description
錯誤訊息
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

成功
IsSuccessful boolean

如果至少有一個分割頁面相符,則會傳回 true。

授權資訊
LicenceInfo string

API 訂閱金鑰的相關資訊

分割輸出檔案
SplittedFile array of object

包含每個分割檔案以及產生的檔案名稱和頁碼等詳細資訊的陣列。

(檔案內容)
SplittedFile.SplitFileContent byte

代表檔案內容的基數 64 字串

(檔案名稱)
SplittedFile.SplitFileName string

包含所產生檔案名稱的字串

(頁面範圍)
SplittedFile.pageNumber string

包含分割作業頁碼的頁面範圍

GetPDFInfo回應

名稱 路徑 類型 Description
允許組合
AllowAssembly boolean

允許旋轉、插入或刪除頁面。

允許降級列印
AllowDegradedPrinting boolean

允許低品質列印。

允許擷取內容
AllowExtractContents boolean

允許提取文本和圖形。

允許擷取協助工具
AllowExtractForAccessibility boolean

允許擷取文字和圖形以支援協助工具。

允許填寫表單
AllowFillInForm boolean

允許填寫表單欄位。

允許修改註解
AllowModifyAnnotations boolean

允許修改註釋。

允許修改內容
AllowModifyContents boolean

允許修改內容。

允許列印
AllowPrinting boolean

允許高品質列印。

作者
Author string

誰建立了文件。

建立日期
CreationDate string

這是建立 PDF 的日期和時間。

Creator
Creator string

原始應用程式或程式庫。

錯誤訊息
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

檔案大小 (位元組)
FileSize number

檔案大小 (以位元組為單位)

有隱藏文字
HasHiddenText boolean

如果 PDF 檔案具有 OCR 圖層,則會傳回 true。

已加密
IsEncrypted boolean

如果此文件是否加密,這將傳回 true。

可搜尋
IsSearchable boolean

如果 PDF 檔案可搜尋,則會傳回 true。

成功
IsSuccessful boolean

如果動作成功,則傳回 true。

關鍵字
Keywords string

關鍵字可以用逗號分隔。

授權資訊
LicenceInfo string

訂用帳戶配額的 Json 摘要。

修改日期
ModifiedDate string

此屬性代表上次修改 PDF 的日期和時間

頁數
NumberofPages integer

PDF 檔案中的頁數。

PDF版本
PDFversion number

建置文件所依據的 PDF 規格版本。

Producer
Producer string

建立 PDF 的產品。 在 PDF 的早期,人們會使用 Microsoft Word 等 Creator 應用程序編寫文檔,將其打印到 PostScript 文件,然後 Producer 將是 Acrobat Distiller,該應用程序將 PostScript 文件轉換為 PDF。 如今,創作者和生產者通常是相同的,或者有一個字段留空。

主旨
Subject string

該文件是關於什麼的。

Title
Title string

文件的標題。

被困
Trapped string

此屬性是布林值,指出文件是否已陷白。 陷印是一種印前工藝,它將顏色區域引入分色中,以掩蓋潛在的套準錯誤。

XMP 中繼資料
XmpMetadata string

可延伸中繼資料平台 (XMP) 是一項 ISO 標準,最初由 Adobe Systems Inc. 建立,用於建立、處理和交換數位文件和資料集的標準化和自訂中繼資料。

ocr_response

OCR 操作的回應資料

名稱 路徑 類型 Description
錯誤訊息
ErrorMessage string

如果 Is Successful 的值為 false,我們將傳回錯誤訊息

成功
IsSuccessful boolean

如果 OCR 成功,則傳回 true。

授權資訊
LicenceInfo string

API 訂閱金鑰的相關資訊

記錄檔內容
LogFileContent byte

作業的日誌內容

已處理的檔案內容
OutputFileContent byte

由 Aquaforest PDF 轉換器生成的文件。