共用方式為


Azure AI 搜尋中的向量索引

向量是高維度內嵌,以數學方式表示文字、影像和其他內容。 Azure AI 搜尋服務會將向量儲存在欄位層級,讓向量和非向量內容共存於相同的 搜尋索引內。

當您定義向量欄位和向量組態時,搜尋索引會變成 向量索引 。 若要填入向量欄位,您可以將 預先計算的內嵌 推送到其中,或使用 整合向量化,這是內建的 Azure AI 搜尋功能,可在編制索引期間產生內嵌。

在查詢時,索引中的向量字段會啟用相似度搜尋,其中系統會擷取向量最類似於向量查詢的檔。 您可以單獨針對相似度比對使用 向量搜尋 ,或使用 混合式搜尋 來尋找相似度和關鍵詞比對的組合。

本文涵蓋建立和管理向量索引的重要概念,包括:

  • 向量擷取模式
  • 內容(向量欄位和組態)
  • 實體資料結構
  • 基本作業

小提示

想要立即開始使用嗎? 請參閱 建立向量索引

向量擷取模式

Azure AI 搜尋支援兩種用於向量擷取的模式:

  • 傳統搜尋。 此模式會使用搜尋列、查詢輸入和呈現的結果。 在查詢執行期間,搜尋引擎或您的應用程式程式代碼會將使用者輸入向量化。 接著,搜尋引擎會對索引中的向量字段執行向量搜尋,並制定您在用戶端應用程式中轉譯的回應。

    在 Azure AI 搜尋中,結果會以扁平化數據列集的形式傳回,您可以選擇要在回應中包含哪些欄位。 雖然搜尋引擎會比對向量,但是您的索引應該包含非向量的、可供人類閱讀的內容,以填入搜尋結果。 傳統搜尋同時支援 向量查詢混合式查詢

  • 行性搜尋。 語言模型會使用來自 Azure AI 搜尋的數據來回應用戶查詢。 協調流程層通常會協調提示並維護內容,將搜尋結果饋送至 GPT 等聊天模型。 此模式是以 擷取增強世代 (RAG) 架構為基礎,其中搜尋索引會提供基礎數據。

向量索引的架構

向量索引的架構需要下列項目:

  • 名稱
  • 索引鍵欄位 (字串)
  • 一或多個向量欄位
  • 向量組態

非函式欄位並非必要,但建議將它們納入混合式查詢,或傳回不經過語言模型的逐字內容。 如需詳細資訊,請參閱建立向量索引

您的索引架構應該反映 向量擷取模式。 本節主要涵蓋傳統搜尋的字段組合,但也提供產生式搜尋的架構指引。

基本向量欄位設定

向量欄位具有唯一的數據類型和屬性。 以下是欄位集合中的向量欄位外觀:

{
    "name": "content_vector",
    "type": "Collection(Edm.Single)",
    "searchable": true,
    "retrievable": true,
    "dimensions": 1536,
    "vectorSearchProfile": "my-vector-profile"
}

向量欄位只支援 特定資料類型 。 最常見的類型是 Collection(Edm.Single),但使用窄型別可以節省儲存空間。

向量字段必須是可搜尋和可擷取的,但無法篩選、分面化或排序。 它們也不能有分析器、正規化程式或同義字對應指派。

屬性 dimensions 必須設定為內嵌模型所產生的內嵌數目。 例如,text-embedding-ada-002 會為每個文字區塊產生 1,536 個內嵌。

向量欄位是使用 在向量搜尋配置檔中指定的演算法來編制索引,該演算法定義於索引的其他地方,但在此範例中不會顯示。 如需詳細資訊,請參閱 新增向量搜尋組態

基本向量工作負載的欄位集合

向量索引需要的不僅僅是向量欄位。 例如,所有索引都必須有索引鍵欄位,如 id 下列範例所示:

"name": "example-basic-vector-idx",
"fields": [
  { "name": "id", "type": "Edm.String", "searchable": false, "filterable": true, "retrievable": true, "key": true },
  { "name": "content_vector", "type": "Collection(Edm.Single)", "searchable": true, "retrievable": true, "dimensions": 1536, "vectorSearchProfile": null },
  { "name": "content", "type": "Edm.String", "searchable": true, "retrievable": true, "analyzer": null },
  { "name": "metadata", "type": "Edm.String", "searchable": true, "filterable": true, "retrievable": true, "sortable": true, "facetable": true }
]

其他欄位,例如 content 欄位,提供人類可讀的 content_vector 對等欄位。 如果您只針對回應公式使用語言模型,您可以省略非向量內容欄位,但直接將搜尋結果推送至用戶端應用程式的解決方案應該具有非向量內容。

元數據欄位對於篩選很實用,特別是如果他們包含源文檔的原點資訊。 雖然無法直接對向量欄位進行篩選,但可設定預先篩選、後置篩選或嚴格後置篩選 (預覽) 模式,在向量查詢執行前後執行篩選。

匯入精靈產生的結構描述

我們建議使用 匯入資料(新)向導 進行評估和概念證明測試。 本節中的範例結構描述是由該精靈產生的。

此精靈會將內容分成較小的搜尋檔,這有利於使用語言模型來制定回應的RAG應用程式。 區塊化可協助您保持在語言模型的輸入限制和語意排序器的標記限制內。 它還通過將查詢與從多個父文件提取的區塊進行匹配,以提高相似性搜索的精確度。 如需詳細資訊,請參閱針對向量搜尋解決方案將大型文件區塊化

針對下列範例中的每個搜尋檔,會有一個區塊標識碼、父標識符、區塊、標題和向量欄位。 精靈:

  • 將 base64 編碼的 Blob 元資料(path)填入 chunk_idparent_id 欄位。

  • 從 Blob 內容擷取chunk字段,從 Blob 名稱擷取title字段。

  • 透過呼叫您提供的 Azure OpenAI 內嵌模型來將vector欄位向量化,以建立chunk欄位。 在此過程中,只有向量場會被完全生成。

"name": "example-index-from-import-wizard",
"fields": [
  { "name": "chunk_id", "type": "Edm.String", "key": true, "searchable": true, "filterable": true, "retrievable": true, "sortable": true, "facetable": true, "analyzer": "keyword"},
  { "name": "parent_id", "type": "Edm.String", "searchable": true, "filterable": true, "retrievable": true, "sortable": true},
  { "name": "chunk", "type": "Edm.String", "searchable": true, "filterable": false, "retrievable": true, "sortable": false},
  { "name": "title", "type": "Edm.String", "searchable": true, "filterable": true, "retrievable": true, "sortable": false},
  { "name": "vector", "type": "Collection(Edm.Single)", "searchable": true, "retrievable": true, "dimensions": 1536, "vectorSearchProfile": "vector-1707768500058-profile"}
]

如果您要為 RAG 和聊天樣式應用程式設計向量記憶體,您可以建立兩個索引:

  • 您為其編製索引和向量化的靜態內容之一。
  • 可用於提示流程中的交談之一。

為了說明目的,本節會使用 chat-with-your-data-solution-accelerator 來建立 chat-indexconversations 索引。

加速器建立之索引的螢幕擷取畫面。

下列來自chat-index的欄位支援生成式搜尋體驗:

"name": "example-index-from-accelerator",
"fields": [
  { "name": "id", "type": "Edm.String", "searchable": false, "filterable": true, "retrievable": true },
  { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "retrievable": true },
  { "name": "content_vector", "type": "Collection(Edm.Single)", "searchable": true, "retrievable": true, "dimensions": 1536, "vectorSearchProfile": "my-vector-profile"},
  { "name": "metadata", "type": "Edm.String", "searchable": true, "filterable": false, "retrievable": true },
  { "name": "title", "type": "Edm.String", "searchable": true, "filterable": true, "retrievable": true, "facetable": true },
  { "name": "source", "type": "Edm.String", "searchable": true, "filterable": true, "retrievable": true  },
  { "name": "chunk", "type": "Edm.Int32", "searchable": false, "filterable": true, "retrievable": true },
  { "name": "offset", "type": "Edm.Int32", "searchable": false, "filterable": true, "retrievable": true }
]

conversations 中的下列欄位支援協調流程與聊天記錄:

"fields": [
    { "name": "id", "type": "Edm.String", "key": true, "searchable": false, "filterable": true, "retrievable": true, "sortable": false, "facetable": false },
    { "name": "conversation_id", "type": "Edm.String", "searchable": false, "filterable": true, "retrievable": true, "sortable": false, "facetable": true },
    { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "retrievable": true },
    { "name": "content_vector", "type": "Collection(Edm.Single)", "searchable": true, "retrievable": true, "dimensions": 1536, "vectorSearchProfile": "default-profile" },
    { "name": "metadata", "type": "Edm.String", "searchable": true, "filterable": false, "retrievable": true },
    { "name": "type", "type": "Edm.String", "searchable": false, "filterable": true, "retrievable": true, "sortable": false, "facetable": true },
    { "name": "user_id", "type": "Edm.String", "searchable": false, "filterable": true, "retrievable": true, "sortable": false, "facetable": true },
    { "name": "sources", "type": "Collection(Edm.String)", "searchable": false, "filterable": true, "retrievable": true, "sortable": false, "facetable": true },
    { "name": "created_at", "type": "Edm.DateTimeOffset", "searchable": false, "filterable": true, "retrievable": true },
    { "name": "updated_at", "type": "Edm.DateTimeOffset", "searchable": false, "filterable": true, "retrievable": true }
]

以下螢幕擷取畫面顯示在conversations中搜尋的結果:

搜尋總管的螢幕擷取畫面,其中包含針對 RAG 應用程式設計的索引結果。

在我們的範例中,搜尋分數為 1.00,因為搜尋不合格。 數個欄位支援協調流程和提示流程:

  • conversation_id 會識別每個聊天會話。
  • type 指出內容來自使用者或助理。
  • created_atupdated_at 將會從記錄中刪除過期的聊天。

實體結構和大小

在 Azure AI 搜尋服務中,索引的實體結構主要是內部實作。 您可以存取其架構、載入及查詢其內容、監視其大小,以及管理其容量。 不過,Microsoft 會管理以搜尋服務儲存的基礎結構和實體資料結構。

索引的大小和實質內容取決於:

  • 文件的數量和組成。

  • 個別欄位的屬性。 例如,可篩選欄位需要更多儲存體。

  • 索引組態,包括指定如何建立內部導覽結構的向量組態。 您可以選擇 HNSW 或詳盡的 KNN 進行相似性搜尋。

Azure AI 搜尋服務會對向量儲存體施加限制,其有助於為所有工作負載維護平衡且穩定的系統。 為了協助您保持在限制之下,會在 Azure 入口網站中個別追蹤和報告向量使用量,並透過服務和索引統計數據以程式設計方式報告。

下列螢幕擷取畫面顯示已設定一個分割區和一個複本的 S1 服務。 此服務有 24 個小索引,每個索引平均有一個向量字段,其中包含 1,536 個內嵌。 第二個圖格顯示向量索引的配額和使用量。 因為向量索引是針對每個向量欄位所建立的內部數據結構,因此向量索引的記憶體一律是索引所使用的整體記憶體的一小部分。 非函式欄位和其他數據結構會取用其餘部分。

顯示儲存體、向量索引和索引計數的使用圖格螢幕擷取畫面。

一篇文章涵蓋向量索引限制和估計,但要強調的兩點是,記憶體上限取決於您搜尋服務的建立日期和定價層。 較新的相同層級服務用於向量索引的容量會大上許多。 基於這些原因,您應該:

基本作業和互動

本節介紹向量運行時間作業,包括連接到和保護單一索引。

附註

沒有移動或複製索引的入口或 API 支援。 一般而言,您可以將應用程式部署至不同的搜尋服務(使用相同的索引名稱),或修改名稱,以在目前的搜尋服務上建立複本,然後加以建置。

索引隔離

在 Azure AI 搜尋服務中,一次可以處理一個索引。 所有索引相關的作業都會以單一索引為目標。 在編製索引或查詢方面,不存在相關索引或獨立索引聯結的概念。

持續可用

索引會在第一份文件編製索引后立即可供查詢使用,但在編製所有文件索引之前,它不會完全運作。 在內部,索引會分配到分區中,並在副本上執行。 實體索引是由內部管理。 您管理邏輯索引。

索引會持續可用,且無法暫停或離線。 由於它被設計為長時間運行,因此即時更新內容並對索引本身進行新增。 如果要求與檔更新一致,查詢可能會暫時傳回不完整的結果。

文件作業 (例如重新整理或刪除) 以及不影響目前索引現有結構或完整性的修改 (例如新增欄位),將保有查詢持續性。 結構更新,例如變更現有的欄位,通常會在開發環境中使用卸除和重建工作流程來管理,或在生產服務上建立新版本的索引。

若要避免 索引重建,某些客戶會建立與舊版並存的新欄位,藉此對欄位進行小變更。 但經過一段時間後,這種做法會導致過時欄位和過時的自訂分析器定義產生孤立的內容,特別是在複寫成本高昂的實際執行索引中。 您可以在索引生命週期管理期間規劃的索引更新期間解決這些問題。

端點連線

所有向量索引編製和查詢要求都會以索引為目標。 端點通常是下列其中一項:

端點 連線和存取控制
<your-service>.search.windows.net/indexes 以索引集合為目標。 在建立、列出或刪除索引時使用。 這些作業需要系統管理員許可權,而且可透過系統管理員 API 金鑰搜尋參與者角色取得。
<your-service>.search.windows.net/indexes/<your-index>/docs 以單一索引的文件集合為目標。 在查詢索引或資料重新整理時使用。 對於查詢,讀取許可權就已足夠,而且可透過查詢 API 金鑰或資料讀取器角色來取得。 資料重新整理需要管理員權限。
  1. 請確定您有權限 (部分機器翻譯) 或 API 存取金鑰 (部分機器翻譯)。 除非您正在查詢現有的索引,否則您需要系統管理員許可權或參與者角色指派,才能管理和檢視搜尋服務上的內容。

  2. 從 Azure 入口網站開始。 建立搜尋服務的人員可以檢視和管理它,包括授與 訪問控制 (IAM) 頁面上其他人的存取權。

  3. 移至其他用戶端以進行程式設計存取。 如需第一個步驟,我們建議 快速入門:使用 RESTazure-search-vector-samples 存放庫進行向量搜尋。

管理向量存放區

Azure 提供一個包含診斷記錄和警示功能的監視平台。 建議您:

安全存取向量資料

Azure AI 搜尋服務會透過 Microsoft Entra ID 實作資料加密、適用於無網際網路案例的私人連線,以及適用於安全存取的角色指派。 如需企業安全性功能的詳細資訊,請參閱 Azure AI 搜尋中的安全性