水產森林 PDF
Aquaforest PDF 連接器包含一組動作,可執行不同的 PDF 操作,例如 Office 365 和 Power Automate 的分割、文字擷取、條碼擷取和 OCR 作業。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure Government 區域 - Azure 中國區域 - 美國國防部 (DoD) |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 連絡人 | |
|---|---|
| 名稱 | 水產森林支持 |
| URL | https://www.aquaforest.com/en/aquaforest-flow-doc.asp |
| support@aquaforest.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | 水產森林有限公司 |
| 網站 | https://www.aquaforest.com/en/aquaforest-connector.asp |
| 隱私策略 | https://www.aquaforest.com/en/privacy policy.pdf |
| 類別 | 內容和文件;資料 |
Aquaforest PDF 連接器包含一組動作,可執行不同的 PDF 操作,例如 Office 365 和 Flow 的分割、文字擷取、條碼擷取和 OCR 作業。
先決條件
首先,您需要創建一個 Aquaforest PDF API 帳戶。 此帳戶用於管理 Aquaforest PDF Actions 和 Aquaforest PDF API。 請使用您的有效電子郵件地址,因為訂閱將連結到此地址。 如果您已經有帳戶,只需 在此處登錄即可。
如何取得認證
正在建立連線
連接器支援下列驗證類型:
| 預設值 | 建立連線的參數。 | 所有區域 | 不可共享 |
預設
適用:所有地區
建立連線的參數。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| API 金鑰 | securestring | 此 API 的 API 金鑰 | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| OCR PDF 或圖像 |
從圖像 PDF 或掃描圖像生成可搜索的 PDF。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。 |
| 取得 PDF 屬性 |
取得有關 PDF 檔案的資訊 |
| 取得條碼值 |
從 PDF 獲取條形碼。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。 |
| 從 PDF 取得文字 |
根據文本位置和正則表達式從 PDF 文件中獲取文本。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。 |
| 從 PDF 取得資料 |
此操作將以鍵/值對的形式從PDF文件中提取重要數據。 |
| 按文本匹配拆分 PDF |
根據使用者定義的文字相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。 |
| 按文本提取 PDF 頁面 |
根據使用者定義的文字相符擷取 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。 |
| 按條形碼分割 PDF |
根據使用者定義的條碼相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。 |
| 按頁面分割 PDF |
根據使用者定義的分割選項分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 |
| 通過條形碼提取 PDF 頁面 |
根據用戶定義的條形碼匹配提取 PDF 文件。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。 |
OCR PDF 或圖像
從圖像 PDF 或掃描圖像生成可搜索的 PDF。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
AquaforestImageTimeout
|
aquaforestImageTimeout | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
作者
|
author | string |
在輸出PDF檔案屬性中設定自訂作者。 |
|
|
自動旋轉
|
autorotate | boolean |
自動旋轉圖像 – 這將確保所有文本正常導向 |
|
|
二值化
|
binarize | integer |
此值通常只能在技術支援的指導下使用。 它可以控制彩色影像的處理方式,並強制使用特定閾值進行二值化。 200 的值已被證明通常在測試中提供良好的結果,但這應該通過“典型”客戶文檔來確認。 透過將此設定為 -1 使用替代方法,該方法將嘗試將文字與任何背景圖像或顏色分開。 這可以改善某些文件(例如報紙和雜誌頁面)的 OCR 結果。 |
|
|
黑色像素限制
|
blackPixelLimit | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
空白頁臨界值
|
blankPageThreshold | integer |
使用此選項可設定影像中必須存在的「像素上」的最小數量,頁面才不會被視為空白。 值為 -1 將關閉空白頁偵測。 |
|
|
盒子尺寸
|
boxSize | integer |
此選項非常適合表單,其中文字周圍的方塊有時會導致某個區域被識別為圖形。 此選項會從 OCR 引擎使用的影像暫存副本中移除方塊。 它不會從最終圖像中刪除框。 從技術上講,此選項會移除具有最小面積 (以像素為單位,並由此屬性定義) 的連接元素。 此選項目前僅適用於雙色調影像。 |
|
|
轉換為 Tiff
|
convertToTiff | boolean |
PDF 文件中的每一頁都會點陣化為 TIFF 影像。 |
|
|
CreateProcess
|
createProcess | boolean |
如果您想通過 pinvoke 啟動進程,請將此設置為 true。 |
|
|
建立日期
|
creationDate | string |
在輸出 PDF 文件屬性中設定自訂建立日期。 日期字串的格式必須為 'yyyy-MM-dd HH:mm:ss'。 |
|
|
歪斜校正
|
deskew | boolean |
傾斜(拉直)影像。 |
|
|
去斑點
|
despeckle | integer |
這會移除影像中高度或寬度小於指定圖形的所有斷開連接的元素(以像素為單位)。 最大值為 9,預設值為 0。 |
|
|
字典查閱
|
dictionaryLookup | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
點陣
|
dotmatrix | boolean |
將此設定為 true 以改善點陣字型的辨識。 預設值為 False。 如果針對非點陣字型設定為 true,則辨識效果可能會很差。 |
|
|
啟用偵錯輸出
|
enableDebugOutput | boolean |
啟用偵錯輸出。 |
|
|
壓縮 PDF (MRC)
|
enableMrc | boolean |
這啟用了混合光柵壓縮,可以顯著減少包含彩色掃描的 PDF 的輸出大小。 請注意,此選項僅適用於來源不是 PDF 或使用 ConvertToTiff 的情況。 |
|
|
PDF/A 輸出
|
enablePDFAOutput | boolean |
是否輸出為 PDF/A。 |
|
|
錯誤模式
|
errorMode | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
來源檔案內容
|
fileContent | True | byte |
OCR 的檔案內容 |
|
具有副檔名的來源檔案名稱
|
fileNameWithExtension | True | string |
具有副檔名或僅副檔名的來源檔案名稱 (具有前導句點 '.') |
|
翻轉偵測
|
flipDetect | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
灰階品質
|
grayscaleQuality | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
啟發學習法
|
heuristics | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
Jbig2Enc旗標
|
jbig2EncFlags | string |
這些標誌將傳遞給用於產生 PDF 產生中使用的影像的 JBIG2 版本的應用程式(假設已啟用此壓縮)。 此選項通常只能在技術支援的指導下使用。 |
|
|
語言
|
language | enum |
選擇以下選項之一會設定要用於 OCR 處理的語言。 預設語言為英文。 |
|
|
LibTiffSavePageAsBmp
|
libTiffSavePageAsBmp | boolean |
有時,如果影像為 1bpp 且具有 LZW 壓縮,則預處理可能會導致影像的顏色反轉(黑變白、白變黑)。 將此設定為 true 以避免這種情況。 |
|
|
最大傾斜校正
|
maxDeskew | float |
頁面傾斜的最大角度。 此選項通常只能在技術支援 ()support@aquaforest.com 的指導下使用。 |
|
|
最小偏斜偏移置信度
|
minDeskewConfidence | float |
此選項通常只能在技術支援 ()support@aquaforest.com 的指導下使用。 |
|
|
修改日期
|
modifiedDate | string |
在輸出 PDF 文件屬性中設定自訂修改日期。 日期字串的格式必須為 'yyyy-MM-dd HH:mm:ss'。 |
|
|
變形
|
morph | string |
在 OCR 之前將應用於二值化圖像的形態選項。 如果設定為空白,則不會套用任何內容。 常見選項包括下面列出的選項,但如需更多選項,請聯繫 support@aquaforest.com。 |
|
|
Mrc背景因素
|
mrcBackgroundFactor | integer |
影像背景部分的取樣大小。 數字越高,用於平均的圖像塊的大小越大,這將導致尺寸減小,但質量也會減小。 預設值為 3 |
|
|
MrcForeground因素
|
mrcForegroundFactor | integer |
影像前景部分的取樣大小。 數字越高,用於平均的圖像塊的大小越大,這將導致尺寸減小,但質量也會減小。 預設值為 3 |
|
|
MrcQuality 先生
|
mrcQuality | integer |
JPEG 品質設定(百分比值 1 - 100)用於儲存背景和前景影像。 預設值為 75 |
|
|
MrcTimeout
|
mrcTimeout | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
無圖片
|
noPictures | boolean |
依預設,如果文件的某個區域被識別為圖形區域,則不會在該區域上執行 OCR 處理。 但是,某些文檔可能包含被識別為“圖形”或“圖片”區域但實際上包含有用文本的區域或框。 將 NoPictures 設定為 True 將導致它忽略識別為圖片的區域,而將其設定為 False 將強制識別為圖片的區域的 OCR。 |
|
|
OcrProcessSetupTimeout
|
ocrProcessSetupTimeout | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
OcrTimeout
|
ocrTimeout | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
密碼
|
password | string |
開啟來源 PDF 檔案的密碼 |
|
|
PdfToImageBpp
|
pdfToImageBpp | enum |
使用引擎 1 時用於點陣化 PDF 頁面的每像素位數。 這僅適用於使用 ConvertToTiff 處理的文件。 此屬性的預設值取自 PDF 頁面。 |
|
|
PdfToImage壓縮
|
pdfToImageCompression | enum |
要設定為從來源 PDF 檔案的每一頁擷取或點陣化的影像的壓縮。 然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。 此屬性的預設值取自來源 PDF 檔案中的每個頁面。 |
|
|
PdfToImageDpi
|
pdfToImageDpi | enum |
要設定為從來源 PDF 檔案的每一頁點陣化的影像的 DPI。 然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。 此屬性的預設值取自來源 PDF 檔案中的每個頁面。 |
|
|
PdfToImageForceVectorCheck
|
pdfToImageForceVectorCheck | boolean |
當處理包含向量物件 (例如 CAD 圖紙) 的文件時,此設定非常有用。 依預設,只會包含向量物件的頁面會點陣化。 沒有任何影像但包含向量物件和電子文字的頁面會從點陣化中略過。 但是,有時可能有一個頁面包含向量物件 (CAD 圖紙),但其標題可能是電子文字。 若要強制點陣化頁面,請將此屬性設定為 true。 |
|
|
PdfToImageIncludeText
|
pdfToImageIncludeText | boolean |
當設定為 False 時,這將防止在從 PDF 擷取的頁面影像中轉譯真實文字 (即以電子方式產生,而不是掃描影像一部分的文字)。 這是因為文本已經可以搜索,因此通常不需要 OCR。 不過,如果此實際文字需要 OCR,則可以將值設定為 True。 |
|
|
PdfToImageMaxRes
|
pdfToImageMaxRes | integer |
點陣化影像的最大解析度。 如果從 PDF 頁面擷取的解析度大於此值,則會設定為此值。 此屬性的預設值為 600。 |
|
|
PdfToImageMinRes
|
pdfToImageMinRes | integer |
點陣化影像的最小解析度。 如果從 PDF 頁面擷取的解析度低於此值,則會設定為此值。 此屬性的預設值為 200。 |
|
|
PDF/A 版本
|
pdfaVersion | enum |
PDF/A 版本。 |
|
|
PipeClientConnectionTimeout
|
pipeClientConnectionTimeout | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
移除空白頁
|
removeBlankPage | boolean |
當 BlankPageThreshold 大於 -1 且 ConvertToTiff 為 true 時,移除空白頁面。 |
|
|
移除行
|
removeLines | boolean |
從圖像中刪除線條以獲得更好的識別。 |
|
|
重新啟動引擎每個
|
restartEngineEvery | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
保留書籤
|
retainBookmarks | boolean |
使用 ConvertToTiff 時,會在輸出中保留來源檔案中的任何書籤。 |
|
|
保留建立日期
|
retainCreationDate | boolean |
在輸出 PDF 文件屬性中保留來源檔案的建立日期。 |
|
|
保留中繼資料
|
retainMetadata | boolean |
使用 ConvertToTiff 時,會在輸出中保留來源檔案中的任何中繼資料。 |
|
|
保留修改日期
|
retainModifiedDate | boolean |
在輸出 PDF 文件屬性中保留來源檔案的修改日期。 |
|
|
保留檢視者偏好設定
|
retainViewerPreferences | boolean |
使用 ConvertToTiff 時,在輸出中保留來源檔案中的任何 PDF 檢視器偏好設定、頁面模式和頁面佈局。 |
|
|
SavePredespeckle
|
savePredespeckle | boolean |
這將在輸出 PDF 中使用原始影像 (即在套用預處理之前)。 |
|
|
Tables
|
tables | boolean |
當此選項設定為 true 時,會嘗試在表格儲存格內進行 OCR。 |
|
|
TextLayerFilterHeight
|
textLayerFilterHeight | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterHeightInverted
|
textLayerFilterHeightInverted | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterPercentage
|
textLayerFilterPercentage | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterPercentageInverted
|
textLayerFilterPercentageInverted | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterRatio
|
textLayerFilterRatio | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterRatio反轉
|
textLayerFilterRatioInverted | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterWidth
|
textLayerFilterWidth | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerFilterWidthInverted
|
textLayerFilterWidthInverted | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
TextLayerMaxBoxes
|
textLayerMaxBoxes | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
整理模式
|
tidyUpMode | integer |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
|
|
驗證 PDF/A
|
validatePDFA | boolean |
轉換後是否驗證 PDF/A 文件 |
|
|
單字比對閾值
|
wordMatchThreshold | float |
請聯絡技術支援 (support@aquaforest.com) 以取得使用此屬性的指引。 |
傳回
OCR 操作的回應資料
- 身體
- ocr_response
取得 PDF 屬性
取得有關 PDF 檔案的資訊
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
頁面限制
|
pageLimit | integer |
要處理的最大頁數,這僅用於檢查頁面是否包含隱藏文本或檢查 PDF 是否可搜索 |
傳回
取得條碼值
從 PDF 獲取條形碼。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
條碼結果範本
|
barcodeResultTemplate | True | string |
如果找到條碼,則輸出文字結果的範本 |
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
無條碼模板
|
noBarcodeTemplate | True | string |
如果找不到條碼,則輸出文字結果的範本 |
|
分隔符號
|
pageSeparator | string |
提供分頁符號,以便您可以知道分頁符號的位置。 |
|
|
頁面
|
pagerange | string |
提供您要從中提取文本的頁面範圍,可以是單個頁碼 (1)、以逗號分隔的多個頁碼 (1,2,3)、一個頁面範圍 (1-4) 或所有頁面範圍的混合 (1,2,4-7)。 |
|
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
類型
|
barcodeFormats | array of string |
指定您要識別的條碼類型 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
頁面 (已棄用)
|
pagenumber | integer |
此屬性已淘汰,建議您使用 Pages 屬性。 頁面屬性會套用至所有區域,並可讓您選取要處理的頁面。 |
|
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。 |
傳回
從 PDF 取得文字
根據文本位置和正則表達式從 PDF 文件中獲取文本。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
無文字比對範本
|
noTextTemplate | True | string |
找不到相符專案時要傳回的文字範本 |
|
分隔符號
|
pageSeparator | string |
提供分頁符號,以便您可以知道分頁符號的位置。 |
|
|
頁面
|
pagerange | string |
提供您要從中提取文本的頁面範圍,可以是單個頁碼 (1)、以逗號分隔的多個頁碼 (1,2,3)、一個頁面範圍 (1-4) 或所有頁面範圍的混合 (1,2,4-7)。 |
|
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
文字結果範本
|
textResultTemplate | True | string |
找到相符專案時要傳回的文字範本 |
|
價值觀
|
expression | array of string |
在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
頁面 (已棄用)
|
pagenumber | integer |
此屬性已淘汰,建議您使用 Pages 屬性。 頁面屬性會套用至所有區域,並可讓您選取要處理的頁面。 |
|
|
選擇
|
position | string |
使用它來優化您提取的更多文本,選擇符合您要求的選項 |
|
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。 |
傳回
從 PDF 取得資料
此操作將以鍵/值對的形式從PDF文件中提取重要數據。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
名稱
|
settingName | True | string |
在此處輸入設定名稱 |
|
價值觀
|
settingValue | True | string |
在此處輸入設定值。 |
|
信賴分數
|
confidenceScore | number |
設定較高的信賴分數,以篩選出信賴度較低的值。 您可以設定介於 0 和 1 之間的任何值。 我們建議從 0.5 開始 |
|
|
日期轉換
|
dateAsISO | string |
選取要傳回日期值的格式 |
|
|
預期索引鍵
|
expectedKeys | string |
每行提供一個索引鍵名稱,讓值可供稍後的動作使用,而無需剖析 JSON。 |
|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
頁面限制
|
pageLimit | integer |
要處理的頁數上限 |
|
|
頁面範圍
|
pageRange | string |
您要處理的頁碼的字串表示法。 例如 1,3-4 |
|
|
條形貨幣符號
|
stripCurrencySymbol | boolean |
如果您希望在傳回貨幣值之前刪除符號和字串,請將此設定為 true |
|
|
比對同義詞
|
synonym | boolean |
如果您希望我們傳回與預期索引鍵同義字的所有索引鍵,請將此設定為 true。 |
|
|
同義詞詞典
|
synonymDictionary | string |
您可以提供「入口」物件的 JSON 陣列,其中每個物件都包含陣列中的同義字清單。 例如,如果您希望將「發票號碼」和「發票號碼」(不區分大小寫)解譯為相同的索引鍵,請使用下列 JSON:[{'entry': [ '發票號碼', '發票號碼' ]}] |
|
|
修剪符號
|
trimSymbols | boolean |
如果您希望我們在找到的鍵中刪除所有前導和尾端符號,然後再將它們與預期的鍵匹配,請將此值設置為 true。 |
傳回
按文本匹配拆分 PDF
根據使用者定義的文字相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
檔案名稱範本
|
fileNameTemplate | True | string |
如果找到文字相符,則輸出檔案的範本 |
|
沒有相符的頁面
|
noMatch | string |
根據您在上面選擇的分割選項,某些頁面將不會提取文字值。 選擇要在這些頁面上執行的動作。 |
|
|
無檔案範本
|
noTextFileName | True | string |
輸出檔案的範本(如果找不到文字相符項) |
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
輸出檔案選項
|
splitOption | string |
從分割操作的輸出檔案中選擇帶有條碼的頁面位置。 |
|
|
價值觀
|
expression | array of string |
在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
選擇
|
position | string |
使用它來優化您提取的更多文本,選擇符合您要求的選項 |
|
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。 |
傳回
按文本提取 PDF 頁面
根據使用者定義的文字相符擷取 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
檔案名稱範本
|
fileNameTemplate | True | string |
如果找到文字相符,則輸出檔案的範本 |
|
無檔案範本
|
noTextFileName | True | string |
輸出檔案的範本(如果找不到文字相符項) |
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
價值觀
|
expression | array of string |
在此處提供一個或多個值以與上述屬性一起使用,我們將返回符合上述規則的第一個文本值。 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
選擇
|
position | string |
使用它來優化您提取的更多文本,選擇符合您要求的選項 |
|
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的文字與其進行匹配並返回匹配項。 |
傳回
按條形碼分割 PDF
根據使用者定義的條碼相符來分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。 此外,Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
檔案名稱範本
|
fileNameTemplate | True | string |
如果找到條碼,則輸出檔案的範本 |
|
沒有相符的頁面
|
noMatch | string |
根據您在上面選擇的分割選項,某些頁面將沒有條碼值。 選擇要在這些頁面上執行的動作。 |
|
|
無條碼匹配模板
|
noTextFileName | True | string |
輸出檔案的範本(如果找不到條碼) |
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
輸出檔案選項
|
splitOption | string |
使用它來優化您提取的更多文本,選擇符合您要求的選項 |
|
|
類型
|
barcodeFormats | array of string |
指定您要識別的條碼類型 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的條形碼與其進行匹配並返回匹配項。 |
傳回
按頁面分割 PDF
根據使用者定義的分割選項分割 PDF 檔案。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容。 |
|
輸出檔案名稱
|
fileNameTemplate | True | string |
目標檔案範本,可包含 %UNIQUEn (唯一編號從 1 開始,零填充至 n 位數) 和 %FILENAME (不含副檔名的原始檔案名稱)。 |
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱。 |
|
分割類型
|
splitOption | True | string |
選擇要用於每個檔案的分割作業。 |
|
頁面範圍
|
pageRange | string |
以逗號分隔的頁面範圍集,定義應從原始頁面擷取哪些頁面。 |
|
|
重複每一次
|
repeatEvery | integer |
將頁面範圍套用至文件內的每一組「頁面範圍」頁面。 例如,如果為頁面範圍指定 2-4,並將 4 指定為重複範圍,則每 4 頁重新套用一次範圍。 |
|
|
保留書籤
|
retainBookmarks | boolean |
產生的檔案將包含原始檔案中的書籤。 |
|
|
保留中繼資料
|
retainMetadata | boolean |
產生的檔案將包含原始檔案的中繼資料(例如作者和標題)。 |
傳回
通過條形碼提取 PDF 頁面
根據用戶定義的條形碼匹配提取 PDF 文件。 請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案內容
|
fileContent | True | byte |
來源檔案的內容 |
|
檔案名稱範本
|
fileNameTemplate | True | string |
如果找到條碼,則輸出檔案的範本 |
|
無檔案範本
|
noTextFileName | True | string |
輸出檔案的範本(如果找不到條碼) |
|
檔案名稱
|
sourceFileName | True | string |
來源檔案的名稱 |
|
類型
|
barcodeFormats | array of string |
指定您要識別的條碼類型 |
|
|
地點
|
location | True | string |
頁面區域 - 使用區域工具取得座標:[https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
樣式
|
regex | string |
如果此處提供了正則表達式,我們會將任何提取的條形碼與其進行匹配並返回匹配項。 |
傳回
定義
ApiExtractPost200ApplicationJson回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
錯誤
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
成功
|
IsSuccessful | boolean |
如果至少擷取了一個頁面,則會傳回 true |
|
授權資訊
|
LicenceInfo | string |
API 訂閱金鑰的相關資訊 |
|
提取輸出文件
|
SplittedFile | array of object |
提取的檔案陣列 |
|
(檔案內容)
|
SplittedFile.SplitFileContent | byte |
代表檔案內容的基數 64 字串 |
|
(檔案名稱)
|
SplittedFile.SplitFileName | string |
包含所產生檔案名稱的字串 |
|
(頁碼)
|
SplittedFile.pageNumber | string |
包含擷取發生的頁碼的頁面範圍 |
ApiGetTextValueJson回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
錯誤訊息
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
成功
|
IsSuccessful | boolean |
如果文字已成功匹配 |
|
授權資訊
|
LicenceInfo | string |
API 訂閱金鑰的相關資訊 |
|
文字結果
|
TextResult | string |
將擷取的文字套用至提供的文字結果範本所產生的字串。 請注意,如果頁面計數大於 1,則會使用頁面分隔符號串連所有頁面。 |
|
Results
|
TextResults | array of object |
包含頁面清單和擷取的文字值的陣列 |
|
(頁碼)
|
TextResults.pageNumber | string |
找到文字的頁面 |
|
(頁面正文)
|
TextResults.valueExtracted | string |
將擷取的文字套用至提供的文字結果範本所產生的字串。 |
|
(區域值)
|
TextResults.zoneValues | array of string |
包含從每個區域擷取的文字的陣列。 |
ApiRenameByBarcodePost200ApplicationJsonResponse
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
條碼
|
BarcodeResult | string |
將擷取的文字套用至提供的條碼結果範本所產生的字串。 請注意,如果頁面計數大於 1,則會使用頁面分隔符號串連所有頁面。 |
|
Results
|
BarcodeResults | array of object |
包含頁面清單和擷取的條碼值的陣列 |
|
(頁碼)
|
BarcodeResults.pageNumber | string |
找到條碼的頁面 |
|
(頁面條碼)
|
BarcodeResults.valueExtracted | string |
將擷取的條碼值套用至提供的條碼結果範本所產生的字串。 |
|
(區域值)
|
BarcodeResults.zoneValues | array of string |
包含從每個區域提取的條碼的陣列。 |
|
錯誤訊息
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
成功
|
IsSuccessful | boolean |
如果偵測到條碼 |
|
授權資訊
|
LicenceInfo | string |
API 訂閱金鑰的相關資訊 |
ApiSplitPost200ApplicationJson回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
錯誤訊息
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
成功
|
IsSuccessful | boolean |
如果至少有一個分割頁面相符,則會傳回 true。 |
|
授權資訊
|
LicenceInfo | string |
API 訂閱金鑰的相關資訊 |
|
分割輸出檔案
|
SplittedFile | array of object |
包含每個分割檔案以及產生的檔案名稱和頁碼等詳細資訊的陣列。 |
|
(檔案內容)
|
SplittedFile.SplitFileContent | byte |
代表檔案內容的基數 64 字串 |
|
(檔案名稱)
|
SplittedFile.SplitFileName | string |
包含所產生檔案名稱的字串 |
|
(頁面範圍)
|
SplittedFile.pageNumber | string |
包含分割作業頁碼的頁面範圍 |
GetPDFInfo回應
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
允許組合
|
AllowAssembly | boolean |
允許旋轉、插入或刪除頁面。 |
|
允許降級列印
|
AllowDegradedPrinting | boolean |
允許低品質列印。 |
|
允許擷取內容
|
AllowExtractContents | boolean |
允許提取文本和圖形。 |
|
允許擷取協助工具
|
AllowExtractForAccessibility | boolean |
允許擷取文字和圖形以支援協助工具。 |
|
允許填寫表單
|
AllowFillInForm | boolean |
允許填寫表單欄位。 |
|
允許修改註解
|
AllowModifyAnnotations | boolean |
允許修改註釋。 |
|
允許修改內容
|
AllowModifyContents | boolean |
允許修改內容。 |
|
允許列印
|
AllowPrinting | boolean |
允許高品質列印。 |
|
作者
|
Author | string |
誰建立了文件。 |
|
建立日期
|
CreationDate | string |
這是建立 PDF 的日期和時間。 |
|
Creator
|
Creator | string |
原始應用程式或程式庫。 |
|
錯誤訊息
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
檔案大小 (位元組)
|
FileSize | number |
檔案大小 (以位元組為單位) |
|
有隱藏文字
|
HasHiddenText | boolean |
如果 PDF 檔案具有 OCR 圖層,則會傳回 true。 |
|
已加密
|
IsEncrypted | boolean |
如果此文件是否加密,這將傳回 true。 |
|
可搜尋
|
IsSearchable | boolean |
如果 PDF 檔案可搜尋,則會傳回 true。 |
|
成功
|
IsSuccessful | boolean |
如果動作成功,則傳回 true。 |
|
關鍵字
|
Keywords | string |
關鍵字可以用逗號分隔。 |
|
授權資訊
|
LicenceInfo | string |
訂用帳戶配額的 Json 摘要。 |
|
修改日期
|
ModifiedDate | string |
此屬性代表上次修改 PDF 的日期和時間 |
|
頁數
|
NumberofPages | integer |
PDF 檔案中的頁數。 |
|
PDF版本
|
PDFversion | number |
建置文件所依據的 PDF 規格版本。 |
|
Producer
|
Producer | string |
建立 PDF 的產品。 在 PDF 的早期,人們會使用 Microsoft Word 等 Creator 應用程序編寫文檔,將其打印到 PostScript 文件,然後 Producer 將是 Acrobat Distiller,該應用程序將 PostScript 文件轉換為 PDF。 如今,創作者和生產者通常是相同的,或者有一個字段留空。 |
|
主旨
|
Subject | string |
該文件是關於什麼的。 |
|
Title
|
Title | string |
文件的標題。 |
|
被困
|
Trapped | string |
此屬性是布林值,指出文件是否已陷白。 陷印是一種印前工藝,它將顏色區域引入分色中,以掩蓋潛在的套準錯誤。 |
|
XMP 中繼資料
|
XmpMetadata | string |
可延伸中繼資料平台 (XMP) 是一項 ISO 標準,最初由 Adobe Systems Inc. 建立,用於建立、處理和交換數位文件和資料集的標準化和自訂中繼資料。 |
ocr_response
OCR 操作的回應資料
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
錯誤訊息
|
ErrorMessage | string |
如果 Is Successful 的值為 false,我們將傳回錯誤訊息 |
|
成功
|
IsSuccessful | boolean |
如果 OCR 成功,則傳回 true。 |
|
授權資訊
|
LicenceInfo | string |
API 訂閱金鑰的相關資訊 |
|
記錄檔內容
|
LogFileContent | byte |
作業的日誌內容 |
|
已處理的檔案內容
|
OutputFileContent | byte |
由 Aquaforest PDF 轉換器生成的文件。 |



