適用於: ✓ 所有自定義模型 |✓ 所有預先建置的模型
文件處理模型是功能強大的工具,可協助您識別、分類及擷取儲存在 SharePoint 文件庫中的文件資訊。
當您將模型套用至 SharePoint 文件庫時,它會連結至定義所擷取資訊結構的內容類型。 此內容類型包含用來儲存擷取數據的數據行,會儲存在 SharePoint 內容類型庫中。 您可以建立專為您的需求量身打造的新內容類型,或使用現有的內容類型來重複使用其架構,並維護整個組織的一致性。
根據您的需求以及您想要管理模型的位置,可以使用兩種方式來建立模型。 企業模型會在 內容中心內建立和管理,使其可在多個 SharePoint 網站上重複使用。 另一方面,本機模型會直接在您網站上的 SharePoint 文檔庫內建立, 且範圍限定在該特定文檔庫。 這可讓您根據需要集中式控制或當地語系化自定義,彈性地選擇正確的模型類型。
自訂模型
您選擇的自定義模型類型取決於您使用的文件類型、這些檔案的結構和格式,以及您打算套用模型的 SharePoint 位置。
自訂模型包括:
若要檢視自定義模型中的並存差異,請參閱 比較自定義模型。
非結構化文件處理
使用字母或合約之類的檔時,請使用非結構化文件處理模型,這些檔不會遵循一致的版面配置,但包含可識別的片語或模式。 此模型會自動分類檔,並根據文字模式擷取相關信息。
例如,合約續約信件的格式可能會有所不同,但一致地包含一個片語,例如“Service start date of”,後面接著日期。 模型會使用這類模式來判斷檔類型 (分類) ,以及用來擷取 (擷取器) 的數據。
- 最適合:具有可辨識文字模式的非結構化檔。
- 檔案支援:最廣泛的檔類型範圍。
- 語言支援:超過 40 種語言。
- 安裝程式:使用 [單一類別模型] 選項。
如需詳細資訊,請參閱 非結構化文件處理概觀。
手繪多邊形文件處理
手繪多邊形文件處理模型非常適合用來從數據可以出現在任何地方的檔擷取資訊,例如掃描的信件、傳真或 PDF。 不同於非結構化模型,手繪多邊形模型不會分類文件類型;它們只著重於擷取數據。
這些模型是使用 Microsoft Power Apps AI Builder 所建置,在處理來自各種來源的大量傳入檔時特別有用。
如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀。
結構化文件處理
針對配置一致的文件選擇結構化文件處理模型,例如窗體或發票。 此模型會根據欄位和數據表在檔中的固定位置來識別欄位和數據表值。
建置 Microsoft Power Apps AI Builder,結構化模型會從範例文件學習,並從未來檔案中的類似位置擷取數據。 例如,稅務窗體可能一律將社會安全號碼放在相同的位置。
- 最適合:結構化或半結構化的檔,例如表單。
- 檔案支援:Forms 一致的版面配置。
- 語言支援:最 廣泛的支持語言。
- 安裝程式:使用 結構化擷取模型 選項。
如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀。
預先建立的模型
除了自定義模型之外,文件處理還提供一組 預先建 置的模型,可提供現成可用的功能,以從一般商務檔擷取結構化資訊。 這些模型的設計目的是要藉由消除手動定型或設定的需求來節省時間和精力。
預先建置的模型包括:
合約處理
合約處理模型的設計目的是要分析和擷取合約檔中的重要資訊。 其可跨各種格式運作,並識別重要的合約詳細數據,例如:
- 用戶端或合作物件名稱
- 帳單位址
- 管轄
- 有效期
此模型適用於管理大量合約的法律、採購或營運小組。
如需詳細資訊,請 參閱使用預先建置的模型從合約擷取資訊。
發票處理
發票處理模型會從銷售發票擷取基本數據,協助簡化帳戶的可付費工作流程。 它可以識別資訊,例如:
- 客戶名稱
- 帳單位址
- 到期日
- 到期金額
此模型特別適用於想要自動開立發票並減少手動數據輸入的財務小組。
如需詳細資訊,請 參閱使用預先建置的模型從發票擷取資訊。
收據處理
收據處理模型會處理列印和手寫收據,擷取密鑰交易詳細數據,例如:
- 商家名稱
- 商家電話號碼
- 交易日期
- 稅金和總金額
此模型非常適合用於費用報告和工作流程。
如需詳細資訊,請 參閱使用預先建置的模型從收據擷取資訊。
敏感性信息處理
敏感性信息處理模型有助於識別及擷取檔中的個人和機密數據。 它可以偵測資訊,例如:
- 社會安全號碼
- 財務帳戶號碼
- 驅動程式的授權識別碼
- PII) (其他個人標識資訊
此模型支援整個組織的合規性和數據保護工作。
如需詳細資訊,請 參閱使用預先建置的模型來偵測檔中的敏感性資訊。
簡單文件處理
簡單的文件處理模型提供彈性且預先定型的解決方案來擷取資訊,例如:
- 機碼/值組
- 選取標記 (例如複選框)
- 具名實體
- 條碼
- 語言偵測
不同於其他具有固定架構的預先建置模型,此模型會適應更廣泛的結構化檔,而且在自定義標籤不可行時是很好的替代方案。
如需詳細資訊,請 參閱使用預先建置的模型來偵測檔中的敏感性資訊。