水產森林 PDF

Aquaforest PDF 連接器包含一組動作，可執行不同的 PDF 操作，例如 Office 365 和 Power Automate 的分割、文字擷取、條碼擷取和 OCR 作業。

此連接器適用於以下產品和區域：

服務	Class	Regions
副駕駛工作室	進階	除下列區域外的所有 Power Automate 區域： - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）
邏輯應用程式	標準	所有 Logic Apps 區域，但下列區域除外： - Azure Government 區域 - Azure 中國區域 - 美國國防部（DoD）
Power Apps	進階	除下列區域外的所有 Power Apps 區域： - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）
Power Automate（自動化服務）	進階	除下列區域外的所有 Power Automate 區域： - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）

連絡人
名稱	水產森林支持
URL	https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email	support@aquaforest.com

連接器中繼資料
Publisher	水產森林有限公司
網站	https://www.aquaforest.com/en/aquaforest-connector.asp
隱私策略	https://www.aquaforest.com/en/privacy policy.pdf
類別	內容和文件;資料

Aquaforest PDF 連接器包含一組動作，可執行不同的 PDF 操作，例如 Office 365 和 Flow 的分割、文字擷取、條碼擷取和 OCR 作業。

先決條件

首先，您需要創建一個 Aquaforest PDF API 帳戶。此帳戶用於管理 Aquaforest PDF Actions 和 Aquaforest PDF API。請使用您的有效電子郵件地址，因為訂閱將連結到此地址。如果您已經有帳戶，只需在此處登錄即可。

如何取得認證

登入開發者入口網站，前往產品頁面，選擇您要訂閱的產品。
按一下「訂閱」按鈕
按一下 「確認」 按鈕以確認您的訂閱要求
您可以在「設定檔」頁面中存取您的 API 金鑰

正在建立連線

連接器支援下列驗證類型：


預設值	建立連線的參數。	所有區域	不可共享

預設

適用：所有地區

建立連線的參數。

這不是可共用的連線。如果 Power App 與其他使用者共用，系統會明確提示其他使用者建立新連線。

名稱	類型	Description	為必填項目
API 金鑰	securestring	此 API 的 API 金鑰	對

節流限制

名稱	呼叫	續約期間
每個連線的 API 呼叫	100	60 秒

動作

OCR PDF 或圖像	從圖像 PDF 或掃描圖像生成可搜索的 PDF。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
取得 PDF 屬性	取得有關 PDF 檔案的資訊
取得條碼值	從 PDF 獲取條形碼。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
從 PDF 取得文字	根據文本位置和正則表達式從 PDF 文件中獲取文本。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
從 PDF 取得資料	此操作將以鍵/值對的形式從PDF文件中提取重要數據。
按文本匹配拆分 PDF	根據使用者定義的文字相符來分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。此外，Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。
按文本提取 PDF 頁面	根據使用者定義的文字相符擷取 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。
按條形碼分割 PDF	根據使用者定義的條碼相符來分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。此外，Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。
按頁面分割 PDF	根據使用者定義的分割選項分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。
通過條形碼提取 PDF 頁面	根據用戶定義的條形碼匹配提取 PDF 文件。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

OCR PDF 或圖像

作業識別碼：: Ocr-file-to-pdf

從圖像 PDF 或掃描圖像生成可搜索的 PDF。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱	機碼	必要	類型	Description
AquaforestImageTimeout	aquaforestImageTimeout		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
作者	author		string	在輸出PDF檔案屬性中設定自訂作者。
自動旋轉	autorotate		boolean	自動旋轉圖像 – 這將確保所有文本正常導向
二值化	binarize		integer	此值通常只能在技術支援的指導下使用。它可以控制彩色影像的處理方式，並強制使用特定閾值進行二值化。 200 的值已被證明通常在測試中提供良好的結果，但這應該通過“典型”客戶文檔來確認。透過將此設定為 -1 使用替代方法，該方法將嘗試將文字與任何背景圖像或顏色分開。這可以改善某些文件（例如報紙和雜誌頁面）的 OCR 結果。
黑色像素限制	blackPixelLimit		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
空白頁臨界值	blankPageThreshold		integer	使用此選項可設定影像中必須存在的「像素上」的最小數量，頁面才不會被視為空白。值為 -1 將關閉空白頁偵測。
盒子尺寸	boxSize		integer	此選項非常適合表單，其中文字周圍的方塊有時會導致某個區域被識別為圖形。此選項會從 OCR 引擎使用的影像暫存副本中移除方塊。它不會從最終圖像中刪除框。從技術上講，此選項會移除具有最小面積（以像素為單位，並由此屬性定義）的連接元素。此選項目前僅適用於雙色調影像。
轉換為 Tiff	convertToTiff		boolean	PDF 文件中的每一頁都會點陣化為 TIFF 影像。
CreateProcess	createProcess		boolean	如果您想通過 pinvoke 啟動進程，請將此設置為 true。
建立日期	creationDate		string	在輸出 PDF 文件屬性中設定自訂建立日期。日期字串的格式必須為 'yyyy-MM-dd HH：mm：ss'。
歪斜校正	deskew		boolean	傾斜（拉直）影像。
去斑點	despeckle		integer	這會移除影像中高度或寬度小於指定圖形的所有斷開連接的元素（以像素為單位）。最大值為 9，預設值為 0。
字典查閱	dictionaryLookup		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
點陣	dotmatrix		boolean	將此設定為 true 以改善點陣字型的辨識。預設值為 False。如果針對非點陣字型設定為 true，則辨識效果可能會很差。
啟用偵錯輸出	enableDebugOutput		boolean	啟用偵錯輸出。
壓縮 PDF （MRC）	enableMrc		boolean	這啟用了混合光柵壓縮，可以顯著減少包含彩色掃描的 PDF 的輸出大小。請注意，此選項僅適用於來源不是 PDF 或使用 ConvertToTiff 的情況。
PDF/A 輸出	enablePDFAOutput		boolean	是否輸出為 PDF/A。
錯誤模式	errorMode		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
來源檔案內容	fileContent	True	byte	OCR 的檔案內容
具有副檔名的來源檔案名稱	fileNameWithExtension	True	string	具有副檔名或僅副檔名的來源檔案名稱（具有前導句點 '.'）
翻轉偵測	flipDetect		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
灰階品質	grayscaleQuality		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
啟發學習法	heuristics		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
Jbig2Enc旗標	jbig2EncFlags		string	這些標誌將傳遞給用於產生 PDF 產生中使用的影像的 JBIG2 版本的應用程式（假設已啟用此壓縮）。此選項通常只能在技術支援的指導下使用。
語言	language		enum	選擇以下選項之一會設定要用於 OCR 處理的語言。預設語言為英文。
LibTiffSavePageAsBmp	libTiffSavePageAsBmp		boolean	有時，如果影像為 1bpp 且具有 LZW 壓縮，則預處理可能會導致影像的顏色反轉（黑變白、白變黑）。將此設定為 true 以避免這種情況。
最大傾斜校正	maxDeskew		float	頁面傾斜的最大角度。此選項通常只能在技術支援（）support@aquaforest.com 的指導下使用。
最小偏斜偏移置信度	minDeskewConfidence		float	此選項通常只能在技術支援（）support@aquaforest.com 的指導下使用。
修改日期	modifiedDate		string	在輸出 PDF 文件屬性中設定自訂修改日期。日期字串的格式必須為 'yyyy-MM-dd HH：mm：ss'。
變形	morph		string	在 OCR 之前將應用於二值化圖像的形態選項。如果設定為空白，則不會套用任何內容。常見選項包括下面列出的選項，但如需更多選項，請聯繫 support@aquaforest.com。
Mrc背景因素	mrcBackgroundFactor		integer	影像背景部分的取樣大小。數字越高，用於平均的圖像塊的大小越大，這將導致尺寸減小，但質量也會減小。預設值為 3
MrcForeground因素	mrcForegroundFactor		integer	影像前景部分的取樣大小。數字越高，用於平均的圖像塊的大小越大，這將導致尺寸減小，但質量也會減小。預設值為 3
MrcQuality 先生	mrcQuality		integer	JPEG 品質設定（百分比值 1 - 100）用於儲存背景和前景影像。預設值為 75
MrcTimeout	mrcTimeout		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
無圖片	noPictures		boolean	依預設，如果文件的某個區域被識別為圖形區域，則不會在該區域上執行 OCR 處理。但是，某些文檔可能包含被識別為“圖形”或“圖片”區域但實際上包含有用文本的區域或框。將 NoPictures 設定為 True 將導致它忽略識別為圖片的區域，而將其設定為 False 將強制識別為圖片的區域的 OCR。
OcrProcessSetupTimeout	ocrProcessSetupTimeout		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
OcrTimeout	ocrTimeout		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
密碼	password		string	開啟來源 PDF 檔案的密碼
PdfToImageBpp	pdfToImageBpp		enum	使用引擎 1 時用於點陣化 PDF 頁面的每像素位數。這僅適用於使用 ConvertToTiff 處理的文件。此屬性的預設值取自 PDF 頁面。
PdfToImage壓縮	pdfToImageCompression		enum	要設定為從來源 PDF 檔案的每一頁擷取或點陣化的影像的壓縮。然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。此屬性的預設值取自來源 PDF 檔案中的每個頁面。
PdfToImageDpi	pdfToImageDpi		enum	要設定為從來源 PDF 檔案的每一頁點陣化的影像的 DPI。然後對這些圖像進行 OCR 處理以創建可搜索的 PDF。此屬性的預設值取自來源 PDF 檔案中的每個頁面。
PdfToImageForceVectorCheck	pdfToImageForceVectorCheck		boolean	當處理包含向量物件（例如 CAD 圖紙）的文件時，此設定非常有用。依預設，只會包含向量物件的頁面會點陣化。沒有任何影像但包含向量物件和電子文字的頁面會從點陣化中略過。但是，有時可能有一個頁面包含向量物件（CAD 圖紙），但其標題可能是電子文字。若要強制點陣化頁面，請將此屬性設定為 true。
PdfToImageIncludeText	pdfToImageIncludeText		boolean	當設定為 False 時，這將防止在從 PDF 擷取的頁面影像中轉譯真實文字（即以電子方式產生，而不是掃描影像一部分的文字）。這是因為文本已經可以搜索，因此通常不需要 OCR。不過，如果此實際文字需要 OCR，則可以將值設定為 True。
PdfToImageMaxRes	pdfToImageMaxRes		integer	點陣化影像的最大解析度。如果從 PDF 頁面擷取的解析度大於此值，則會設定為此值。此屬性的預設值為 600。
PdfToImageMinRes	pdfToImageMinRes		integer	點陣化影像的最小解析度。如果從 PDF 頁面擷取的解析度低於此值，則會設定為此值。此屬性的預設值為 200。
PDF/A 版本	pdfaVersion		enum	PDF/A 版本。
PipeClientConnectionTimeout	pipeClientConnectionTimeout		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
移除空白頁	removeBlankPage		boolean	當 BlankPageThreshold 大於 -1 且 ConvertToTiff 為 true 時，移除空白頁面。
移除行	removeLines		boolean	從圖像中刪除線條以獲得更好的識別。
重新啟動引擎每個	restartEngineEvery		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
保留書籤	retainBookmarks		boolean	使用 ConvertToTiff 時，會在輸出中保留來源檔案中的任何書籤。
保留建立日期	retainCreationDate		boolean	在輸出 PDF 文件屬性中保留來源檔案的建立日期。
保留中繼資料	retainMetadata		boolean	使用 ConvertToTiff 時，會在輸出中保留來源檔案中的任何中繼資料。
保留修改日期	retainModifiedDate		boolean	在輸出 PDF 文件屬性中保留來源檔案的修改日期。
保留檢視者偏好設定	retainViewerPreferences		boolean	使用 ConvertToTiff 時，在輸出中保留來源檔案中的任何 PDF 檢視器偏好設定、頁面模式和頁面佈局。
SavePredespeckle	savePredespeckle		boolean	這將在輸出 PDF 中使用原始影像（即在套用預處理之前）。
Tables	tables		boolean	當此選項設定為 true 時，會嘗試在表格儲存格內進行 OCR。
TextLayerFilterHeight	textLayerFilterHeight		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterHeightInverted	textLayerFilterHeightInverted		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterPercentage	textLayerFilterPercentage		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterPercentageInverted	textLayerFilterPercentageInverted		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterRatio	textLayerFilterRatio		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterRatio反轉	textLayerFilterRatioInverted		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterWidth	textLayerFilterWidth		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerFilterWidthInverted	textLayerFilterWidthInverted		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
TextLayerMaxBoxes	textLayerMaxBoxes		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
整理模式	tidyUpMode		integer	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。
驗證 PDF/A	validatePDFA		boolean	轉換後是否驗證 PDF/A 文件
單字比對閾值	wordMatchThreshold		float	請聯絡技術支援（support@aquaforest.com）以取得使用此屬性的指引。

傳回

OCR 操作的回應資料

身體: ocr_response

取得 PDF 屬性

作業識別碼：: Get-pdf-information

取得有關 PDF 檔案的資訊

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
頁面限制	pageLimit		integer	要處理的最大頁數，這僅用於檢查頁面是否包含隱藏文本或檢查 PDF 是否可搜索

傳回

身體: GetPDFInfoResponse

取得條碼值

作業識別碼：: Get-barcode-value

從 PDF 獲取條形碼。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱	機碼	必要	類型	Description
條碼結果範本	barcodeResultTemplate	True	string	如果找到條碼，則輸出文字結果的範本
檔案內容	fileContent	True	byte	來源檔案的內容
無條碼模板	noBarcodeTemplate	True	string	如果找不到條碼，則輸出文字結果的範本
分隔符號	pageSeparator		string	提供分頁符號，以便您可以知道分頁符號的位置。
頁面	pagerange		string	提供您要從中提取文本的頁面範圍，可以是單個頁碼（1）、以逗號分隔的多個頁碼（1,2,3）、一個頁面範圍（1-4）或所有頁面範圍的混合（1,2,4-7）。
檔案名稱	sourceFileName	True	string	來源檔案的名稱
類型	barcodeFormats		array of string	指定您要識別的條碼類型
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
頁面（已棄用）	pagenumber		integer	此屬性已淘汰，建議您使用 Pages 屬性。頁面屬性會套用至所有區域，並可讓您選取要處理的頁面。
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

身體: ApiRenameByBarcodePost200ApplicationJsonResponse

從 PDF 取得文字

作業識別碼：: Get-text-value

根據文本位置和正則表達式從 PDF 文件中獲取文本。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
無文字比對範本	noTextTemplate	True	string	找不到相符專案時要傳回的文字範本
分隔符號	pageSeparator		string	提供分頁符號，以便您可以知道分頁符號的位置。
頁面	pagerange		string	提供您要從中提取文本的頁面範圍，可以是單個頁碼（1）、以逗號分隔的多個頁碼（1,2,3）、一個頁面範圍（1-4）或所有頁面範圍的混合（1,2,4-7）。
檔案名稱	sourceFileName	True	string	來源檔案的名稱
文字結果範本	textResultTemplate	True	string	找到相符專案時要傳回的文字範本
價值觀	expression		array of string	在此處提供一個或多個值以與上述屬性一起使用，我們將返回符合上述規則的第一個文本值。
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
頁面（已棄用）	pagenumber		integer	此屬性已淘汰，建議您使用 Pages 屬性。頁面屬性會套用至所有區域，並可讓您選取要處理的頁面。
選擇	position		string	使用它來優化您提取的更多文本，選擇符合您要求的選項
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

身體: ApiGetTextValueJsonResponse

從 PDF 取得資料

作業識別碼：: Get-data-from-pdf

此操作將以鍵/值對的形式從PDF文件中提取重要數據。

參數

名稱	機碼	必要	類型	Description
名稱	settingName	True	string	在此處輸入設定名稱
價值觀	settingValue	True	string	在此處輸入設定值。
信賴分數	confidenceScore		number	設定較高的信賴分數，以篩選出信賴度較低的值。您可以設定介於 0 和 1 之間的任何值。我們建議從 0.5 開始
日期轉換	dateAsISO		string	選取要傳回日期值的格式
預期索引鍵	expectedKeys		string	每行提供一個索引鍵名稱，讓值可供稍後的動作使用，而無需剖析 JSON。
檔案內容	fileContent	True	byte	來源檔案的內容
頁面限制	pageLimit		integer	要處理的頁數上限
頁面範圍	pageRange		string	您要處理的頁碼的字串表示法。例如 1,3-4
條形貨幣符號	stripCurrencySymbol		boolean	如果您希望在傳回貨幣值之前刪除符號和字串，請將此設定為 true
比對同義詞	synonym		boolean	如果您希望我們傳回與預期索引鍵同義字的所有索引鍵，請將此設定為 true。
同義詞詞典	synonymDictionary		string	您可以提供「入口」物件的 JSON 陣列，其中每個物件都包含陣列中的同義字清單。例如，如果您希望將「發票號碼」和「發票號碼」（不區分大小寫）解譯為相同的索引鍵，請使用下列 JSON：[{'entry'： [ '發票號碼'， '發票號碼' ]}]
修剪符號	trimSymbols		boolean	如果您希望我們在找到的鍵中刪除所有前導和尾端符號，然後再將它們與預期的鍵匹配，請將此值設置為 true。

傳回

此作業會輸出隨機的結果。

按文本匹配拆分 PDF

作業識別碼：: Split-by-text

根據使用者定義的文字相符來分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。此外，Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
檔案名稱範本	fileNameTemplate	True	string	如果找到文字相符，則輸出檔案的範本
沒有相符的頁面	noMatch		string	根據您在上面選擇的分割選項，某些頁面將不會提取文字值。選擇要在這些頁面上執行的動作。
無檔案範本	noTextFileName	True	string	輸出檔案的範本（如果找不到文字相符項）
檔案名稱	sourceFileName	True	string	來源檔案的名稱
輸出檔案選項	splitOption		string	從分割操作的輸出檔案中選擇帶有條碼的頁面位置。
價值觀	expression		array of string	在此處提供一個或多個值以與上述屬性一起使用，我們將返回符合上述規則的第一個文本值。
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
選擇	position		string	使用它來優化您提取的更多文本，選擇符合您要求的選項
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

身體: ApiSplitPost200ApplicationJsonResponse

按文本提取 PDF 頁面

作業識別碼：: Extract-by-text

根據使用者定義的文字相符擷取 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
檔案名稱範本	fileNameTemplate	True	string	如果找到文字相符，則輸出檔案的範本
無檔案範本	noTextFileName	True	string	輸出檔案的範本（如果找不到文字相符項）
檔案名稱	sourceFileName	True	string	來源檔案的名稱
價值觀	expression		array of string	在此處提供一個或多個值以與上述屬性一起使用，我們將返回符合上述規則的第一個文本值。
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
選擇	position		string	使用它來優化您提取的更多文本，選擇符合您要求的選項
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的文字與其進行匹配並返回匹配項。

傳回

身體: ApiExtractPost200ApplicationJsonResponse

按條形碼分割 PDF

作業識別碼：: Split-by-barcode

根據使用者定義的條碼相符來分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。此外，Aquaforest Zonal Extraction Tool 可在 [https://www.aquaforest.com/en/zone/get-pdf-zone.html] 獲得。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
檔案名稱範本	fileNameTemplate	True	string	如果找到條碼，則輸出檔案的範本
沒有相符的頁面	noMatch		string	根據您在上面選擇的分割選項，某些頁面將沒有條碼值。選擇要在這些頁面上執行的動作。
無條碼匹配模板	noTextFileName	True	string	輸出檔案的範本（如果找不到條碼）
檔案名稱	sourceFileName	True	string	來源檔案的名稱
輸出檔案選項	splitOption		string	使用它來優化您提取的更多文本，選擇符合您要求的選項
類型	barcodeFormats		array of string	指定您要識別的條碼類型
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的條形碼與其進行匹配並返回匹配項。

傳回

身體: ApiSplitPost200ApplicationJsonResponse

按頁面分割 PDF

作業識別碼：: Split-by-page-range

根據使用者定義的分割選項分割 PDF 檔案。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得文件。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容。
輸出檔案名稱	fileNameTemplate	True	string	目標檔案範本，可包含 %UNIQUEn （唯一編號從 1 開始，零填充至 n 位數）和 %FILENAME （不含副檔名的原始檔案名稱）。
檔案名稱	sourceFileName	True	string	來源檔案的名稱。
分割類型	splitOption	True	string	選擇要用於每個檔案的分割作業。
頁面範圍	pageRange		string	以逗號分隔的頁面範圍集，定義應從原始頁面擷取哪些頁面。
重複每一次	repeatEvery		integer	將頁面範圍套用至文件內的每一組「頁面範圍」頁面。例如，如果為頁面範圍指定 2-4，並將 4 指定為重複範圍，則每 4 頁重新套用一次範圍。
保留書籤	retainBookmarks		boolean	產生的檔案將包含原始檔案中的書籤。
保留中繼資料	retainMetadata		boolean	產生的檔案將包含原始檔案的中繼資料（例如作者和標題）。

傳回

身體: ApiSplitPost200ApplicationJsonResponse

通過條形碼提取 PDF 頁面

作業識別碼：: Extract-by-barcode

根據用戶定義的條形碼匹配提取 PDF 文件。請造訪 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] 以取得更多資訊。

參數

名稱	機碼	必要	類型	Description
檔案內容	fileContent	True	byte	來源檔案的內容
檔案名稱範本	fileNameTemplate	True	string	如果找到條碼，則輸出檔案的範本
無檔案範本	noTextFileName	True	string	輸出檔案的範本（如果找不到條碼）
檔案名稱	sourceFileName	True	string	來源檔案的名稱
類型	barcodeFormats		array of string	指定您要識別的條碼類型
地點	location	True	string	頁面區域 - 使用區域工具取得座標：[https://www.aquaforest.com/en/zone/get-pdf-zone.html]
樣式	regex		string	如果此處提供了正則表達式，我們會將任何提取的條形碼與其進行匹配並返回匹配項。

傳回

身體: ApiExtractPost200ApplicationJsonResponse

定義

ApiExtractPost200ApplicationJson回應

名稱	路徑	類型	Description
錯誤	ErrorMessage	string	如果 Is Successful 的值為 false，我們將傳回錯誤訊息
成功	IsSuccessful	boolean	如果至少擷取了一個頁面，則會傳回 true
授權資訊	LicenceInfo	string	API 訂閱金鑰的相關資訊
提取輸出文件	SplittedFile	array of object	提取的檔案陣列
（檔案內容）	SplittedFile.SplitFileContent	byte	代表檔案內容的基數 64 字串
（檔案名稱）	SplittedFile.SplitFileName	string	包含所產生檔案名稱的字串
（頁碼）	SplittedFile.pageNumber	string	包含擷取發生的頁碼的頁面範圍

ApiGetTextValueJson回應

名稱	路徑	類型	Description
錯誤訊息	ErrorMessage	string	如果 Is Successful 的值為 false，我們將傳回錯誤訊息
成功	IsSuccessful	boolean	如果文字已成功匹配
授權資訊	LicenceInfo	string	API 訂閱金鑰的相關資訊
文字結果	TextResult	string	將擷取的文字套用至提供的文字結果範本所產生的字串。請注意，如果頁面計數大於 1，則會使用頁面分隔符號串連所有頁面。
Results	TextResults	array of object	包含頁面清單和擷取的文字值的陣列
（頁碼）	TextResults.pageNumber	string	找到文字的頁面
（頁面正文）	TextResults.valueExtracted	string	將擷取的文字套用至提供的文字結果範本所產生的字串。
（區域值）	TextResults.zoneValues	array of string	包含從每個區域擷取的文字的陣列。

ApiRenameByBarcodePost200ApplicationJsonResponse

名稱	路徑	類型	Description
條碼	BarcodeResult	string	將擷取的文字套用至提供的條碼結果範本所產生的字串。請注意，如果頁面計數大於 1，則會使用頁面分隔符號串連所有頁面。
Results	BarcodeResults	array of object	包含頁面清單和擷取的條碼值的陣列
（頁碼）	BarcodeResults.pageNumber	string	找到條碼的頁面
（頁面條碼）	BarcodeResults.valueExtracted	string	將擷取的條碼值套用至提供的條碼結果範本所產生的字串。
（區域值）	BarcodeResults.zoneValues	array of string	包含從每個區域提取的條碼的陣列。
錯誤訊息	ErrorMessage	string	如果 Is Successful 的值為 false，我們將傳回錯誤訊息
成功	IsSuccessful	boolean	如果偵測到條碼
授權資訊	LicenceInfo	string	API 訂閱金鑰的相關資訊

ApiSplitPost200ApplicationJson回應

名稱	路徑	類型	Description
錯誤訊息	ErrorMessage	string	如果 Is Successful 的值為 false，我們將傳回錯誤訊息
成功	IsSuccessful	boolean	如果至少有一個分割頁面相符，則會傳回 true。
授權資訊	LicenceInfo	string	API 訂閱金鑰的相關資訊
分割輸出檔案	SplittedFile	array of object	包含每個分割檔案以及產生的檔案名稱和頁碼等詳細資訊的陣列。
（檔案內容）	SplittedFile.SplitFileContent	byte	代表檔案內容的基數 64 字串
（檔案名稱）	SplittedFile.SplitFileName	string	包含所產生檔案名稱的字串
（頁面範圍）	SplittedFile.pageNumber	string	包含分割作業頁碼的頁面範圍

GetPDFInfo回應

名稱	路徑	類型	Description
允許組合	AllowAssembly	boolean	允許旋轉、插入或刪除頁面。
允許降級列印	AllowDegradedPrinting	boolean	允許低品質列印。
允許擷取內容	AllowExtractContents	boolean	允許提取文本和圖形。
允許擷取協助工具	AllowExtractForAccessibility	boolean	允許擷取文字和圖形以支援協助工具。
允許填寫表單	AllowFillInForm	boolean	允許填寫表單欄位。
允許修改註解	AllowModifyAnnotations	boolean	允許修改註釋。
允許修改內容	AllowModifyContents	boolean	允許修改內容。
允許列印	AllowPrinting	boolean	允許高品質列印。
作者	Author	string	誰建立了文件。
建立日期	CreationDate	string	這是建立 PDF 的日期和時間。
Creator	Creator	string	原始應用程式或程式庫。
錯誤訊息	ErrorMessage	string	如果 Is Successful 的值為 false，我們將傳回錯誤訊息
檔案大小（位元組）	FileSize	number	檔案大小（以位元組為單位）
有隱藏文字	HasHiddenText	boolean	如果 PDF 檔案具有 OCR 圖層，則會傳回 true。
已加密	IsEncrypted	boolean	如果此文件是否加密，這將傳回 true。
可搜尋	IsSearchable	boolean	如果 PDF 檔案可搜尋，則會傳回 true。
成功	IsSuccessful	boolean	如果動作成功，則傳回 true。
關鍵字	Keywords	string	關鍵字可以用逗號分隔。
授權資訊	LicenceInfo	string	訂用帳戶配額的 Json 摘要。
修改日期	ModifiedDate	string	此屬性代表上次修改 PDF 的日期和時間
頁數	NumberofPages	integer	PDF 檔案中的頁數。
PDF版本	PDFversion	number	建置文件所依據的 PDF 規格版本。
Producer	Producer	string	建立 PDF 的產品。在 PDF 的早期，人們會使用 Microsoft Word 等 Creator 應用程序編寫文檔，將其打印到 PostScript 文件，然後 Producer 將是 Acrobat Distiller，該應用程序將 PostScript 文件轉換為 PDF。如今，創作者和生產者通常是相同的，或者有一個字段留空。
主旨	Subject	string	該文件是關於什麼的。
Title	Title	string	文件的標題。
被困	Trapped	string	此屬性是布林值，指出文件是否已陷白。陷印是一種印前工藝，它將顏色區域引入分色中，以掩蓋潛在的套準錯誤。
XMP 中繼資料	XmpMetadata	string	可延伸中繼資料平台（XMP）是一項 ISO 標準，最初由 Adobe Systems Inc. 建立，用於建立、處理和交換數位文件和資料集的標準化和自訂中繼資料。

ocr_response