共用方式為


Foundry Tools 中的 Azure 內容瞭解文件解決方案

Content Understanding 提供複雜的檔分析功能。 組織可以使用這些功能,將非結構化內容轉換成可採取動作且有組織的數據。 Content Understanding 可以使用 可自定義的分析器,從各種不同的文件和表格中,專家地擷取基本資訊、欄位和關聯性。

商務使用案例

文件分析器可以處理各種格式和範本的複雜文件:

  • 合約生命週期管理: 從各種合約類型中擷取關鍵欄位、條款和義務。
  • 貸款和抵押貸款申請: 自動化處理,以加快銀行、貸款人和政府實體的處理速度。
  • 金融服務: 分析複雜的檔,例如財務報告和資產管理報告。
  • 費用管理: 剖析各種零售商的收據和發票,以驗證不同格式和範本之間的費用。
  • 文件集和知識庫案例: 從文件集擷取關鍵字段。 藉由套用多重步驟推理,新增處理驗證和擴充等工作的參考數據。

主要優點

Content Understanding 提供功能強大的檔分析功能,專為解決重要企業和商務案例而設計,例如 RAG 和機器人程式自動化。 主要優點包括:

  • 智慧型搜尋啟用: 將非結構化檔轉換成結構化、可搜尋的數據資產,以改善整個組織的資訊可探索性和輔助功能。
  • 扎實的數據提取: 維持擷取數據的清楚可追溯性和適當本地化,以促進人機互動的有效審查流程,並確保透明性和合規性。
  • 信賴驅動自動化: 使用內建信賴評分,以智慧方式自動化文件處理工作,以協助您優化資源配置、降低營運成本,以及增強決策精確度。
  • 彈性自定義: 輕鬆調整和量身打造檔分析器,以配合特定的商務程式和工作流程。 自定義可讓您精確擷取和分類,以符合您組織的特定需求。
  • 增強精確度和可靠性: 達成重要商務數據的精確擷取和分類,以減少錯誤,並改善自動化工作流程的營運效率。
  • 代理程式就緒: 以已準備好用於代理程式工作流程的標準格式處理您的多樣化輸入並傳遞輸出。 輸出可以讓您的應用程式理解使用者的意圖,而由 strongly-typed 結構描述支援的資料則能讓您更容易快速取得資料格式,準備好讓您的程式碼使用。。

文件分析器功能

顯示檔擷取流程的螢幕快照。

內容擷取

內容擷取構成了 Content Understanding 檔分析功能的基礎。 此程式會將非結構化檔轉換成結構化且可讀取的數據。 內容擷取可精確擷取列印和手寫文字,同時透過進階版面配置分析來保留文件的結構:

  • 內容分析
    • 文字:處理多語系內容,包括來自數百種語言的計算機印刷和手寫文字。
    • 選取標記:識別及擷取選取指標,例如複選框、按鈕和類似的標記。
    • 條碼偵測:掃描和譯碼來自十幾種類型的線性和二維條碼的資訊。
    • 數學公式:擷取並保留 LaTeX 格式的複雜數學表達式。
    • 影像元素:尋找並擷取圖片、圖表、圖表及其相關說明與註解。
    • 超連結元素:偵測文件中嵌入的超連結。
    • 註解元素:將內容與註解相關聯,如劃線、底線、高亮。
    • 圖形元素:偵測並提取圖形元素,形成結構化輸出。
  • 結構分析
    • 段落:根據文字內容和角色來偵測和分類文字區段。
    • 表格資料:辨識及擷取資料結構,包括具有跨單元格和多頁版面配置的複雜格式。
    • 階層式區段:透過區段標頭和巢狀內容關聯性來對應內容組織。
  • 擷取擴增生成 (RAG)
    • RAG 解決方案:內容擷取可形成有效RAG系統的基礎,方法是將原始多模式數據轉換成經過優化以擷取的結構化、可搜尋格式。 若要進一步瞭解建置 RAG 解決方案,請參閱檢索增強生成

欄位擷取

透過欄位擷取,您可以從自定義的各種文件和窗體中擷取、分類及產生結構化數據,以符合您的需求。 將非結構化內容轉換成有組織、可採取動作的資訊的程式可簡化數據管理、改善可搜尋性,並支援自動化工作流程。

例如,您可以順暢地從發票擷取客戶詳細數據、帳單位址和分項費用。 您也可以在法律合約中識別合約當事人、續約日期和付款條款。 若要將效率最大化,您可以使用預先建置的分析器範本,例如針對發票量身打造的範本。 您也可以從頭設計定製分析器,透過標記更多範例檔來增強精確度。

信賴度和基礎設置 API 為可選功能。 若要針對欄位擷取加入信賴度和基礎設置,請在分析器設定中設定 estimateFieldSourceAndConfidence = true 或針對特定欄位設定 estimateSourceAndConfidence = true

欄位擷取方法

Content Understanding 提供多用途的字段擷取方法,可讓您精確且量身打造地處理文件內容:

  • 擷取:擷取特定資料,例如從收據中擷取交易日期或從發票中擷取明細項目,以獲得精確且專注的資訊。
  • 分類:將文件內容分類為預先定義的類別,例如將情感分類應用於客戶通話文字記錄,或將項目分類在酒店收據中。
  • 產生:從文件產生新的深入解析或摘要,包括文件摘要,以及章節概觀,以增強內容輔助功能和理解。

輸入需求

如需支援輸入檔格式的詳細資訊,請參閱 服務配額和限制

支援的語言和區域

如需支援的語言和區域清單,請參閱 語言和區域支援

資料、隱私權和安全性

使用 Content Understanding 的開發人員應該檢閱 Microsoft 對於客戶數據的原則。 如需詳細資訊,請參閱 資料、隱私權和安全性