Zanran Scafolder (預覽版)
Zanran 腳手架從 PDF 或圖像文件中提取表格和文本。 表格提取為 Excel 或 XML,文本提取為 XML。 腳手架最適合財務報表、科學論文、經紀人報告等報告......最初,您可以使用手動、匿名、練習網站測試您的文檔: www.zanrandemoapi.com
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure Government 區域 - Azure 中國區域 - 美國國防部 (DoD) |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 連絡人 | |
|---|---|
| 名稱 | 贊然聯繫方式 |
| URL | https://pdf.zanran.com/contact-us |
| helpdesk@zanran.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | 贊然有限公司 |
| 網站 | http://www.zanran.com |
| 隱私策略 | https://pdf.zanran.com/privacy-policy |
| 類別 | 內容和文件;生產力 |
Zanran Scafolder 伺服器提供了一個 Web API,使用戶能夠自動從 PDF 和圖像中提取內容。 它主要用於從報告(年度賬目、科學論文、市場報告等)中提取Zanran 的 Scaffolder 引擎會自動確定這些文件的結構和佈局,並將內容提取為組成部分:文字區塊(例如段落);桌子;和圖像/圖形。 它使用計算機視覺和機器學習,並以 Excel 和 XML 等結構化格式輸出數據。 它是可擴展的,不需要任何手動干預或預定義模板、任何培訓或配置。 該軟件與語言無關,專為自動化/RPA 環境構建,可處理數百萬個文件。
先決條件
此聯結器可存取免費服務,以從 PDF 中少量擷取文字和表格。 先決條件:使用者名稱(電子郵件地址)和密碼(您發明的)。
如何取得認證
請於以下網址登記: http://scaffolderlink.zanran.com/
已知問題與限制
我們建議使用「原生」PDF 進行測試,而不是掃描的 PDF,以消除 OCR 的任何影響。
正在建立連線
連接器支援下列驗證類型:
| 預設值 | 建立連線的參數。 | 所有區域 | 不可共享 |
預設
適用:所有地區
建立連線的參數。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 使用者名稱 | securestring | 此 API 的使用者名稱 | 對 |
| 密碼 | securestring | 此 API 的密碼 | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 上傳文件 |
上傳文件 |
| 下載結果為 Xlsx |
將表格分析的結果下載為 Excel (Xlsx) 文件,每個表格都有單獨的工作表。 |
| 取得狀態 |
獲取正在上傳的文件的狀態 - 即它是否在要處理的隊列中、正在處理或已完成處理 |
| 將結果下載為 Znr 檔案 |
以 Znr 文件的形式下載結果,然後可以通過 Pdf Workbench(為此目的設計的 Zanran 工具)查看和編輯該文件 |
| 將結果下載為壓縮的 Xml 檔案 |
下載包含 Xml 格式分析結果的 zip 檔案 (每頁一個 Xml 檔案) |
上傳文件
上傳文件
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
檔案
|
file | True | file |
要上傳的文件檔案 |
|
開始頁面
|
startPage | integer |
如果只分析範圍,則開始頁面 |
|
|
結束頁面
|
endPage | integer |
如果只分析範圍,則結束頁面 |
|
|
坐標
|
Coords | string |
要分析的表格座標(用於處理單頁。注意:這是一項特殊要求;如果您想使用此參數,請透過以下方式聯絡 helpdesk@zanran.com 我們,詢問如何進行 |
傳回
- response
- string
下載結果為 Xlsx
將表格分析的結果下載為 Excel (Xlsx) 文件,每個表格都有單獨的工作表。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
沒有副檔名的文件名稱
|
docname | True | string |
沒有副檔名的原始文件檔名 |
傳回
- response
- file
取得狀態
獲取正在上傳的文件的狀態 - 即它是否在要處理的隊列中、正在處理或已完成處理
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
沒有副檔名的文件名稱
|
docname | True | string |
沒有副檔名的原始文件檔案名稱 |
傳回
- response
- string
將結果下載為 Znr 檔案
以 Znr 文件的形式下載結果,然後可以通過 Pdf Workbench(為此目的設計的 Zanran 工具)查看和編輯該文件
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
沒有副檔名的文件名稱
|
docname | True | string |
沒有副檔名的原始文件檔名 |
傳回
- response
- file
將結果下載為壓縮的 Xml 檔案
下載包含 Xml 格式分析結果的 zip 檔案 (每頁一個 Xml 檔案)
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
沒有副檔名的文件名稱
|
docname | True | string |
沒有副檔名的原始文件檔名 |
傳回
- response
- file
定義
檔案
這是基本資料類型「檔案」。
字串
這是基本資料類型「string」。