セマンティック検索 (SQL Server)

統計セマンティック検索では、統計的に関連する キーフレーズを抽出してインデックスを作成することで、SQL Server データベースに格納されている非構造化ドキュメントに関する詳細な分析情報を提供します。また、これらのキーフレーズを使用して、 類似または関連するドキュメントを識別し、インデックスを作成します。

これらのセマンティックインデックスのクエリを実行するには、3 つの Transact-SQL 行セット関数を使用して、構造化データとして結果を取得します。

セマンティック検索でできること

セマンティック検索は、SQL Server の既存のフルテキスト検索機能に基づいていますが、キーワード検索を超える新しいシナリオが可能になります。フルテキスト検索ではドキュメント内の単語に対してクエリを実行できますが、セマンティック検索ではドキュメントの意味を照会できます。可能になったソリューションには、タグの自動抽出、関連するコンテンツ検出、類似コンテンツ間の階層ナビゲーションなどがあります。たとえば、キーフレーズのインデックスに対してクエリを実行して、組織またはドキュメントのコーパスの分類を作成できます。または、ドキュメントの類似性インデックスに対してクエリを実行して、ジョブの説明に一致する履歴書を特定することもできます。

セマンティック検索の機能の例を次に示します。

ドキュメント内のキーフレーズを検索する

次のクエリでは、サンプルドキュメントで識別されたキーフレーズを取得します。各キーフレーズの統計的有意性をランク付けするスコアによって、結果が降順に表示されます。このクエリは、 semantickeyphrasetable (Transact-SQL) 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC

類似ドキュメントまたは関連ドキュメントを検索する

次のクエリは、サンプルドキュメントと類似または関連していると識別されたドキュメントを取得します。結果は、2 つのドキュメントの類似性をランク付けするスコアによって降順に表示されます。このクエリは、 semanticsimilaritytable (Transact-SQL) 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC

ドキュメントを類似または関連させるキーフレーズを検索する

次のクエリでは、2 つのサンプルドキュメントを類似または相互に関連付けるキーフレーズを取得します。各キーフレーズの重みをランク付けするスコアによって、結果が降順に表示されます。このクエリは、 semanticsimilaritydetailstable (Transact-SQL) 関数を呼び出します。

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC

SQL Server へのドキュメントの格納

セマンティック検索を使用してドキュメントのインデックスを作成する前に、SQL Server データベースにドキュメントを格納する必要があります。

SQL Server 2014 の FileTable 機能は、非構造化ファイルとドキュメントをリレーショナルデータベースの第一級の市民にします。その結果、データベース開発者は、セットベースの操作で構造化データと共にドキュメント Transact-SQL 操作できます。

FileTable 機能の詳細については、「 FileTables (SQL Server)」を参照してください。データベースにドキュメントを格納するためのもう 1 つのオプションである FILESTREAM 機能の詳細については、 FILESTREAM (SQL Server) を参照してください。

次の方法で共有

セマンティック検索 (SQL Server)

セマンティック検索でできること

ドキュメント内のキー フレーズを検索する

類似ドキュメントまたは関連ドキュメントを検索する

ドキュメントを類似または関連させるキー フレーズを検索する

SQL Server へのドキュメントの格納

関連タスク

関連コンテンツ

その他のリソース

ドキュメント内のキーフレーズを検索する

ドキュメントを類似または関連させるキーフレーズを検索する