現代代理需要先進的搜尋與檢索功能,才能有效存取並處理來自多元資料來源的資訊。 本文探討在代理架構中實作搜尋與檢索的四大主要模式:Microsoft內建的搜尋功能、結構化資料庫查詢、自訂語意索引,以及混合多步驟方法。
每種模式在開發者工作量、控制細節及效能特性方面都有明顯優勢與取捨。 了解這些模式有助於解決方案架構師根據其具體使用案例、現有基礎設施及效能需求,選擇最佳方案。
主要考量涵蓋:
- Microsoft內建搜尋功能:開發工作量極低,平台受限
- 結構化查詢:直接存取計算與推導值的資料庫
- 自訂索引:最大化控制但實作複雜度增加
- 混合方法:具備績效權衡的全面分析
以下章節將詳細說明每種模式的架構、實作考量及最佳使用案例,以指導您的搜尋與檢索策略決策。
內建搜尋功能
Microsoft內建的搜尋功能,透過使用由Microsoft 365基礎架構維護的預設索引,提供最低開發者工作量的方法。 這些功能包括 Copilot 連接器、SharePoint 知識庫及網頁搜尋功能。
此模型能無縫整合 Microsoft 365 生態系統,但限制對索引屬性、索引區間及支援檔案類型的控制,僅限於平台提供的功能。 搜尋的順序與排名仍不受開發者控制,使此方法適合通用搜尋情境,但對專業需求而言可能受限。
備註
語意索引會回傳資料的片段(短摘錄),因此不適合需要完整文件或全面表格分析的情境。 需要從長文件中多頁或試算表中多張表格取得資訊的使用案例,並不適合這種搜尋類型。
結構化資料庫查詢
結構化查詢架構利用語言模型產生查詢語言字串的能力,以執行於現有資料庫系統。 此方法優化了需要資料庫儲存系統中已解決計算或推導值的工作流程。
當代理需要透過既有的查詢語言(如 SQL、KQL 和 DAX,資料分析表達式)存取結構化資料時,此模型表現尤為出色。 優化的資料庫檢視還能進一步提升效能,預先計算常見查詢模式並簡化語言模型的資料存取。
備註
開發者應提供完整的文件與欄位描述,使語言模型能產生適當的查詢。 雖然語言模型精通查詢語言,但它們需要詳細的資料結構與關係背景,才能產生有效的查詢。
自訂語意索引
自訂語意索引需要開發者建立外部託管的索引,並具備自訂的解析、排名、字典及片段大小配置。 此方法提供對搜尋結果的細緻控制,並針對特定內容類型與使用情境進行專門優化。
由於自訂語意索引作為 Microsoft 365 託管代理的外部工具,它們能實現反覆推理迴圈與複雜的多步驟搜尋操作。 這種彈性支援需要特定領域優化或專門內容處理的複雜搜尋情境。
混合多回合方法
混合式方法結合結構化或語意搜尋以進行初始檔案識別,並以多回合流程進行全面內容分析。 此模式能對完整檔案內容提供更深入的推理,同時管理全面分析的效能影響。
備註
多回合流程因需多次服務呼叫才能產生完整回應,需額外處理時間。 此方法以犧牲回應時間為代價提供完整性,適合於全面分析優先於速度需求的情境。
後續步驟
決定你的代理人如何與外部系統互動,並執行超越簡單資訊檢索的行動。