統計語意搜尋藉由擷取和編製統計相關的 關鍵片語,深入解析儲存在 SQL Server 資料庫中的非結構化檔案。 然後,它也會使用這些關鍵片語來識別和編製 類似或相關文件的索引。
您可以使用三個 Transact-SQL 數據列集函式,將結果擷取為結構化數據,來查詢這些語意索引。
我可以使用語意搜尋做什麼?
語意搜尋是以 SQL Server 中現有的全文搜尋功能為基礎,但可啟用超越關鍵詞搜尋的新案例。 雖然全文搜索可讓您查詢檔中的 文字 ,但語意搜尋可讓您查詢檔 的意義 。 現在可能的解決方案包括自動標記擷取、相關的內容探索,以及跨類似內容進行階層式導覽。 例如,您可以查詢關鍵片語的索引,以建置組織的分類法,或用於文件集。 或者,您可以查詢檔相似度索引,以識別符合作業描述的履歷。
下列範例示範語意搜尋的功能。
在文件中尋找關鍵片語
下列查詢會取得範例檔中識別的關鍵片語。 它會依分數以遞減順序呈現結果,以排序每個關鍵片語的統計意義。 此查詢會呼叫 semantickeyphrasetable (Transact-SQL) 函式。
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS Title, keyphrase, score
FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)
ORDER BY score DESC
尋找類似或相關的檔
下列查詢會取得識別為類似或與範例檔相關的檔。 它會依排名 2 份檔的相似度分數,以遞減順序呈現結果。 此查詢會呼叫 semanticsimilaritytable (Transact-SQL) 函式。
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,
DocumentID, score
FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)
INNER JOIN Documents ON DocumentID = matched_document_key
ORDER BY score DESC
尋找讓檔類似或相關的關鍵片語
下列查詢會取得讓 2 個範例檔類似或彼此相關的關鍵片語。 它根據每個關鍵片語的權重分數,以遞減順序呈現結果。 此查詢會呼叫 semanticsimilaritydetailstable (Transact-SQL) 函式。
SET @SourceTitle = 'first.docx'
SET @MatchedTitle = 'second.docx'
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score
FROM semanticsimilaritydetailstable(Documents, DocumentContent,
@SourceDocID, DocumentContent, @MatchedDocID)
ORDER BY score DESC
將文件儲存在 SQL Server 中
您必須先將文件儲存在 SQL Server 資料庫中,才能使用語意搜尋編製檔索引。
SQL Server 2014 中的 FileTable 功能使得關係資料庫中的非結構化檔案和文件成為核心組成部分。 因此,資料庫開發人員可以透過 Transact-SQL 集合基礎的操作,同時處理文件和結構化數據。
如需 FileTable 功能的詳細資訊,請參閱 FileTables (SQL Server) 。 如需 FILESTREAM 功能的相關信息,這是將檔案儲存在資料庫中的另一個選項,請參閱 FILESTREAM (SQL Server) 。
相關工作
安裝和設定語意搜尋
描述統計語意搜尋的必要元件以及如何安裝或檢查這些必要元件。
在數據表和數據行上啟用語意搜尋
描述如何針對包含文件或文字的選取資料行啟用或停用統計語意索引。
使用語意搜尋在文件中尋找關鍵片語組
描述如何在設定為統計語意索引的文件或文字資料行中尋找主要片語。
使用語意搜尋尋找類似和相關文件
描述如何在設定進行統計語意索引的資料行中尋找相似或相關的文件或文字值,以及相似或相關程度的詳細資訊。
管理和監視語意搜尋
描述語意編製索引的程式,以及監視和管理索引的相關工作。
相關內容
語意搜尋 DDL、函式、預存程式和檢視
列出新增或變更 Transact-SQL 語句和 SQL Server 資料庫物件,以支援統計語意搜尋。