통계 의미 체계 검색은 통계적으로 관련된 핵심 구를 추출하고 인덱싱하여 SQL Server 데이터베이스에 저장된 구조화되지 않은 문서에 대한 심층적인 인사이트를 제공합니다. 그런 다음 이러한 핵심 구를 사용하여 유사하거나 관련된 문서를 식별하고 인덱싱합니다.
세 개의 Transact-SQL 행 집합 함수를 사용하여 이러한 의미 체계 인덱스를 쿼리하여 결과를 구조화된 데이터로 검색합니다.
의미 체계 검색을 사용하여 무엇을 할 수 있나요?
의미 체계 검색은 SQL Server의 기존 전체 텍스트 검색 기능을 기반으로 하지만 키워드 검색 이상으로 확장되는 새로운 시나리오를 사용하도록 설정합니다. 전체 텍스트 검색을 사용하면 문서의 단어를 쿼리할 수 있지만 의미 체계 검색을 통해 문서의 의미를 쿼리할 수 있습니다. 이제 가능한 솔루션에는 자동 태그 추출, 관련 콘텐츠 검색 및 유사한 콘텐츠의 계층적 탐색이 포함됩니다. 예를 들어 핵심 구의 인덱스를 쿼리하여 조직 또는 문서 모음에 대한 분류를 작성할 수 있습니다. 또는 문서 유사성 인덱스를 쿼리하여 작업 설명과 일치하는 이력서를 식별할 수 있습니다.
다음 예제에서는 의미 체계 검색의 기능을 보여 줍니다.
문서에서 핵심 구 찾기
다음 쿼리는 샘플 문서에서 식별된 핵심 구를 가져옵니다. 각 핵심 구의 통계적 유의 순위를 매기는 점수를 기준으로 결과를 내림차순으로 표시합니다. 이 쿼리는 semantickeyphrasetable(Transact-SQL) 함수를 호출합니다.
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS Title, keyphrase, score
FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)
ORDER BY score DESC
유사 문서 또는 관련 문서 찾기
다음 쿼리는 샘플 문서와 유사하거나 관련된 것으로 식별된 문서를 가져옵니다. 2개 문서의 유사성 순위를 매기는 점수를 기준으로 결과를 내림차순으로 표시합니다. 이 쿼리는 의미 체계(Transact-SQL) 함수를 호출합니다.
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,
DocumentID, score
FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)
INNER JOIN Documents ON DocumentID = matched_document_key
ORDER BY score DESC
유사하거나 관련된 문서를 만드는 핵심 구문 찾기
다음 쿼리는 2개의 샘플 문서를 유사하거나 서로 관련시키는 핵심 구를 가져옵니다. 각 핵심 구의 가중치를 매기는 점수를 기준으로 결과를 내림차순으로 표시합니다. 이 쿼리는 semanticsimilaritydetailstable(Transact-SQL) 함수를 호출합니다.
SET @SourceTitle = 'first.docx'
SET @MatchedTitle = 'second.docx'
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score
FROM semanticsimilaritydetailstable(Documents, DocumentContent,
@SourceDocID, DocumentContent, @MatchedDocID)
ORDER BY score DESC
SQL Server에 문서 저장
의미 체계 검색을 사용하여 문서를 인덱싱하려면 SQL Server 데이터베이스에 문서를 저장해야 합니다.
SQL Server 2014의 FileTable 기능은 관계형 데이터베이스의 구조화되지 않은 파일 및 문서 일류 시민을 만듭니다. 따라서 데이터베이스 개발자는 Transact-SQL 집합 기반 작업에서 구조적 데이터와 함께 문서를 조작할 수 있습니다.
FileTable 기능에 대한 자세한 내용은 FileTables(SQL Server)를 참조하세요. 데이터베이스에 문서를 저장하는 또 다른 옵션인 FILESTREAM 기능에 대한 자세한 내용은 FILESTREAM(SQL Server)을 참조하세요.
관련 작업
의미 체계 검색 설치 및 구성
통계 의미 체계 검색의 필수 구성 요소 및 설치 또는 확인 방법에 대해 설명합니다.
테이블 및 열에서 의미 체계 검색 사용
문서 또는 텍스트가 들어 있는 선택한 열에서 통계 의미 체계 인덱싱을 사용하거나 사용하지 않도록 설정하는 방법에 대해 설명합니다.
의미 체계 검색을 사용하여 문서에서 핵심 구 찾기
통계 의미 체계 인덱싱을 위해 구성된 문서 또는 텍스트 열에서 키 구를 찾는 방법에 대해 설명합니다.
의미 체계 검색을 사용하여 유사 문서 및 관련 문서 찾기
통계적 의미 체계 인덱싱을 위해 구성된 열에서 유사하거나 관련된 문서 또는 텍스트 값을 찾고 유사하거나 연관된 정도에 관한 정보를 찾는 방법에 대해 설명합니다.
의미 체계 검색 관리 및 모니터링
의미 체계 인덱싱 프로세스 및 인덱스 모니터링 및 관리와 관련된 작업에 대해 설명합니다.
관련 내용
시맨틱 검색 DDL, 함수, 저장 프로시저 및 뷰
통계 의미 체계 검색을 지원하기 위해 추가되거나 변경된 Transact-SQL 문 및 SQL Server 데이터베이스 개체를 나열합니다.