다음을 통해 공유


Azure AI 검색의 기능

Azure AI 검색은 정보 검색 기능을 제공하고 선택적 AI 통합을 사용하여 텍스트 및 벡터 콘텐츠에서 더 많은 가치를 추출합니다.

다음 표에는 범주별로 해당 기능이 요약되어 있습니다. 모든 Azure 퍼블릭, 프라이빗 및 소버린 클라우드에는 기능 패리티가 있지만 일부 기능은 특정 지역 또는 특정 계층에서 지원되지 않습니다.

Note

미리 보기 기능을 찾고 계신가요? 미리 보기 기능 목록을 참조하세요.

인덱싱 및 데이터 추출

Category Features
데이터 원본 JSON 문서로 제출된 경우 검색 인덱스에서 모든 원본의 텍스트를 허용할 수 있습니다.

인덱서는 지원되는 데이터 원본에서 데이터 가져오기를 자동화하여 기본 데이터 저장소에서 검색 가능한 콘텐츠를 추출하는 기능입니다. 인덱서는 JSON serialization을 처리하며 대부분은 일부 형태의 변경 및 삭제 검색을 지원합니다. Microsoft OneLake, Azure SQL Database, Azure Cosmos DB 또는 AzureBlob Storage를 비롯한 다양한 데이터 원본에 연결할 수 있습니다.

Logic Apps 커넥터(미리 보기) 를 사용하면 다른 클라우드 플랫폼의 데이터를 포함하여 광범위한 데이터 원본에 액세스할 수 있습니다. 이 인덱싱 및 보강 파이프라인은 Azure AI Search에서 만들지만 Azure Logic Apps에서 관리됩니다.
계층형 및 중첩 데이터 구조 복합 형식 및 컬렉션을 사용하면 거의 모든 유형의 JSON 구조를 검색 인덱스로 모델링할 수 있습니다. 일대다 및 다대다 카디널리티는 컬렉션, 복합 형식 및 복합 형식 컬렉션을 통해 고유하게 표현할 수 있습니다.
언어 분석 분석기는 인덱싱 및 검색 작업 중 텍스트 처리에 사용되는 구성 요소입니다. 기본적으로, 범용 표준 Lucene 분석기를 사용하거나, 언어 분석기, 구성한 사용자 지정 분석기 또는 필요한 형식으로 토큰을 생성하는 미리 정의된 다른 분석기를 사용하여 기본값을 재정의할 수 있습니다.

Lucene 또는 Microsoft의 언어 분석기는 동사 시제, 성별, 불규칙한 복수 명사(예: '마우스' 및 '마우스'), 단어 분해, 단어 분리(공백이 없는 언어의 경우) 등 언어별 언어를 지능적으로 처리하는 데 사용됩니다.

사용자 지정 어휘 분석기는 윗주 일치 및 정규식과 같은 복잡한 쿼리 형식에 사용됩니다.

채팅 모델 및 에이전트 통합

Category Features
인덱싱 중에 사용되는 채팅 완료 모델 GenAI 프롬프트 기술(미리 보기) 은 인덱싱 중에 큰 언어 모델을 호출하고 작업을 결정하는 프롬프트를 제공하는 기술입니다. 작업이 무엇인지 결정합니다. 이미지를 설명하거나, 콘텐츠를 요약하거나 조작하거나, 모델이 수행할 수 있는 작업을 설명할 수 있습니다. 출력은 검색 가능한 인덱스에서 새 필드로 추가됩니다.
쿼리 시간에 사용되는 채팅 완료 모델 에이전트 검색(미리 보기) 은 인덱스에 대한 쿼리 범위를 향상하기 위해 복잡한 쿼리를 쿼리 계획, 분해 및 의역하는 데 큰 언어 모델을 사용합니다. 에이전트 검색의 응답은 에이전트-에이전트 워크플로용으로 설계되었습니다. 검색 결과를 단일 큰 문자열로 전달하여 독점 콘텐츠의 에이전트 사용을 간소화할 수 있습니다. 응답에는 인용 및 쿼리 실행 정보도 포함됩니다.

RAG 패턴은 기존 기능을 사용하여 구현할 수 있습니다. 관련성을 조정하고 하이브리드 쿼리를 생성하는 기능은 응답 생성을 위해 채팅 봇에 전송되는 콘텐츠의 품질을 향상시킵니다.

적용된 AI 및 AI 보강 콘텐츠

Category Features
인덱싱 중 AI 처리 AI 보강은 전체 텍스트 검색을 위해 인덱싱할 수 없는 콘텐츠에서 텍스트 및 정보를 추출하는 인덱서 파이프라인에 포함된 이미지 및 자연어 처리를 나타냅니다. AI 처리는 기술 세트에서 기술을 추가하고 결합한 다음 인덱서에 연결하여 수행됩니다. AI는 텍스트 번역이나 OCR(광학 문자 인식)과 같은 기본 제공 기술이나 사용자가 제공하는 사용자 지정 기술일 수 있습니다.

통합 데이터 청크 및 벡터화 는 더 큰 통로를 벡터화할 수 있는 더 작은 청크로 분할하고, 벡터는 벡터 및 하이브리드 검색을 위해 인덱스의 전용 필드로 라우팅됩니다.
쿼리 실행 중 AI 처리 벡터라이저 는 벡터 검색을 위해 사용자 쿼리 문자열을 벡터로 인코딩하는 데 사용됩니다. 인덱싱에 사용한 쿼리에 동일한 포함 모델을 사용할 수 있습니다.

비검색 시나리오에서 분석하고 사용할 수 있도록 보강된 콘텐츠 저장 지식 저장소 는 지식 마이닝 및 데이터 과학 워크로드와 같은 비 검색 시나리오를 위한 AI 보강 또는 AI 생성 콘텐츠의 영구 스토리지입니다. 지식 저장소는 기술 세트에 정의되어 있지만 Azure Storage에서 개체 또는 테이블 형식 행 집합으로 만들어집니다.
캐시된 보강 보강 캐싱(미리 보기)은 기술 세트 실행 중에 다시 사용할 수 있는 캐시된 보강을 나타냅니다. 캐싱은 처리 비용이 많이 드는 OCR 및 이미지 분석을 포함하는 기술 세트에서 유용합니다.

벡터 및 하이브리드 검색

Category Features
벡터 인덱싱 검색 인덱스 내에서 벡터 필드를 추가하여 벡터 검색 시나리오를 지원합니다. 벡터 필드는 동일한 검색 문서의 비벡터 필드와 공존할 수 있습니다.
벡터 쿼리 단일 및 복수 벡터 쿼리를 작성합니다.
벡터 검색 알고리즘 검색 인덱스에서 유사한 벡터를 찾으려면 HNSW(Hierarchical Navigable Small World)를 사용하거나 완전 KNN(K-Nearest Neighbors)을 사용합니다.
벡터 필터 정보 검색 시 정밀도를 높이기 위해 쿼리 실행 전후에 필터를 적용합니다.
하이브리드 정보 검색 단일 하이브리드 쿼리 요청 개념 및 키워드를 검색합니다.

하이브리드 검색은 최상의 결과를 위해 선택적 의미 체계 순위 지정 및 관련성 튜닝과 함께 벡터 및 텍스트 검색을 통합합니다.
통합 데이터 청킹 및 벡터화 텍스트 분할 기술을 통한 원시 데이터 청크. Microsoft Foundry 모델 카탈로그의 엔드포인트에 연결하기 위해 사용할 수 있는 벡터라이저Azure OpenAI Embedding, Azure Vision 멀티모달, AML 같은 포함 기술을 통한 네이티브 벡터화

통합된 벡터화는 원본 파일에서 쿼리로 엔드투엔드 인덱싱 파이프라인을 제공합니다.
통합 벡터 압축 및 양자화 기본 제공 스칼라 및 이진 양자화를 사용하여 메모리 및 디스크에서 벡터 인덱스 크기를 줄입니다. 필요하지 않은 벡터의 스토리지를 포기하거나 스토리지 요구 사항을 줄이기 위해 벡터 필드에 좁은 데이터 형식을 할당할 수도 있습니다.

전체 텍스트 및 기타 쿼리 양식

Category Features
자유 형식 텍스트 검색 전체 텍스트 검색은 대부분의 검색 기반 앱에서 기본적으로 사용되는 검색 방식입니다. 쿼리는 지원되는 구문을 사용하여 작성할 수 있습니다.

단순 쿼리 구문 은 논리 연산자, 구 검색 연산자, 접미사 연산자, 우선 순위 연산자를 제공합니다.

전체 Lucene 쿼리 구문 에는 유사 항목 검색, 근접 검색, 용어 승격 및 정규식에 대한 확장과 함께 간단한 구문의 모든 작업이 포함됩니다.
Relevance 간단한 점수 매기기는 Azure AI Search의 핵심적인 장점입니다. 점수 매기기 프로필은 문서 자체의 값에 대한 함수로서 관련성을 모델링하는 데 사용됩니다. 예를 들어 최신 제품 또는 할인 제품을 검색 결과의 더 높은 부분에 나타내려고 할 수 있습니다. 또한 따로 추적하고 저장한 고객 검색 기본 설정에 따라 개인화된 점수에 태그를 사용하여 점수 매기기 프로필을 만들 수도 있습니다.

의미 체계 순위는 쿼리에 대한 의미 체계 관련성에 따라 결과를 재전송하는 프리미엄 기능입니다. 콘텐츠 및 시나리오에 따라 거의 최소한의 구성이나 노력으로 검색 관련성을 크게 향상시킬 수 있습니다.
지리 공간적 검색 지리 공간적 함수는 지리적 좌표를 필터링하고 일치시킵니다. 거리를 일치시키거나 다각형 도형에 포함하여 일치시킬 수 있습니다.
필터 및 패싯 패싯 탐색은 단일 쿼리 매개 변수를 통해 사용하도록 설정됩니다. Azure AI 검색은 자기 주도형 필터링(예: 가격 범위 또는 브랜드별로 카탈로그 항목 필터링)을 위해 코드 숨김 카탈로그 목록으로 사용할 수 있는 패싯 탐색 구조를 반환합니다.

필터를 사용하여 패싯 탐색을 애플리케이션의 UI에 통합하고, 쿼리 공식을 향상시키고, 사용자 또는 개발자가 지정한 기준에 따라 필터링할 수 있습니다. OData 구문을 사용하여 필터를 만듭니다.
사용자 환경 자동 완성은 검색 창의 자동 완성 쿼리에 사용할 수 있습니다.

검색 제안은 검색 창에서 부분 텍스트 입력에서 작동하지만 결과는 쿼리 용어가 아닌 인덱스의 실제 문서입니다.

동의어는 사용자가 대체 용어를 제공하지 않고도 쿼리 범위를 암시적으로 확장하는 동등한 용어를 연결합니다.

적중 항목 강조 표시 는 검색 결과에서 일치하는 키워드에 텍스트 서식을 적용합니다. 강조 표시된 코드 조각을 반환하는 필드를 선택할 수 있습니다.

정렬은 인덱스 스키마를 통해 여러 필드에 대해 제공된 다음 쿼리 시 단일 검색 매개 변수를 사용하여 전환됩니다.

검색 결과 페이징 및 제한은 Azure AI Search가 검색 결과에 대해 제공하는 세밀하게 조정된 컨트롤을 사용하여 간단합니다.

보안 기능

Category Features
네트워크 보안 인바운드 방화벽 지원에 대한 IP 규칙을 사용하면 검색 서비스에서 요청을 수락하는 IP 범위를 설정할 수 있습니다.

Azure Private Link를 사용하여 프라이빗 엔드포인트를 만들어 가상 네트워크를 통해 모든 요청을 강제로 적용합니다.

네트워크 보안 경계 지원을 사용하면 네트워크 액세스를 전체적으로 관리할 수 있도록 Azure AI Search를 다른 Azure 리소스를 포함하는 네트워크 보안 경계에 조인할 수 있습니다.
데이터 암호화. Microsoft 관리형 저장 데이터 암호화는 내부 스토리지 레이어에 내장되어 있으며 취소할 수 없습니다.

Azure Key Vault에서 만들고 관리하는 CMK(고객 관리형 암호화 키)는 인덱스 및 동의어 맵의 추가 암호화에 사용할 수 있습니다. 2020년 8월 1일 이후에 만들어진 서비스의 경우 CMK 암호화는 인덱싱된 콘텐츠의 전체 이중 암호화를 위해 임시 디스크의 데이터까지 확장됩니다.
인바운드 액세스 역할 기반 액세스 제어는 검색 콘텐츠 및 작업에 대한 제어된 액세스를 위해 Microsoft Entra ID의 사용자 및 그룹에 역할을 할당합니다. 역할 할당을 사용하지 않으려면 키 기반 인증을 사용할 수도 있습니다.

문서 수준 액세스 제어(미리 보기) 는 사용자에게 볼 권한이 없는 검색 결과를 필터링합니다. 여러 데이터 원본의 경우 데이터 원본이 액세스 제어 모델을 제공하는 경우 사용자 권한 메타데이터를 상속하도록 인덱스를 구성할 수 있습니다.
아웃바운드 보안(인덱서) 프라이빗 엔드포인트를 통한 데이터 연결을 통해 인덱서는 Azure Private Link를 통해 보호되는 Azure 리소스에 연결할 수 있습니다.

관리 ID를 통한 데이터 연결은 Microsoft Entra 보안 주체를 사용하여 Azure 리소스에 대한 연결을 인증하므로 하드 코딩된 API 키의 스토리지 및 전달이 제거됩니다.

신뢰할 수 있는 ID를 사용하는 데이터 액세스 는 외부 데이터 원본에 대한 연결 문자열이 사용자 이름과 암호를 생략할 수 있음을 의미합니다. 인덱서가 데이터 원본에 연결되면 검색 서비스가 이전에 신뢰할 수 있는 서비스로 등록된 경우 리소스에서 연결을 허용합니다(Azure Storage에만 적용됨).

포털 기능

Category Features
프로토타입 및 검사용 도구 인덱스 추가는 Azure Portal에서 특성 필드 및 몇 가지 다른 설정으로 구성된 기본 스키마를 만드는 데 사용할 수 있는 인덱 스 디자이너입니다. 인덱스를 저장한 후에는 SDK 또는 REST API를 사용하여 데이터를 제공하는 방법으로 작성할 수 있습니다.

데이터 가져오기 마법사 는 인덱스, 인덱서, 기술 세트 및 데이터 원본 정의를 만듭니다. 데이터가 Azure에 있는 경우, 이 마법사는 특히 개념 증명 조사 및 탐색에 대해 상당한 시간과 노력을 절감할 수 있습니다.

데이터 가져오기(새) 마법사는 데이터 청크 및 벡터화를 포함하는 전체 인덱싱 파이프라인을 만듭니다. 마법사는 모든 개체 및 구성 설정을 만듭니다.

검색 탐색 기는 쿼리를 테스트하고 점수 매기기 프로필을 구체화하는 데 사용됩니다.

데모 앱 만들기 는 검색 환경을 테스트하는 데 사용할 수 있는 HTML 페이지를 생성하는 데 사용됩니다.

디버그 세션 은 대화형으로 기술 세트를 디버그할 수 있는 시각적 편집기입니다. 이것은 종속성, 출력 및 변환을 보여 줍니다.
모니터링 및 진단 모니터링 기능을 사용하여 Azure Portal에서 항상 표시되는 메트릭을 한눈에 볼 수 있습니다. 필요한 추가 구성 없이 포털 페이지에서 초당 쿼리 수, 대기 시간 및 제한에 대한 메트릭이 캡처되고 보고됩니다.

Programmability

Category Features
REST 서비스 REST API는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다.

관리 REST API 는 Azure Resource Manager를 통해 서비스를 만들고 프로비전하기 위한 것입니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다.
.NET용 Azure SDK Azure.Search.Documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다.

Microsoft.Azure.Management.Search 는 Azure Resource Manager를 통해 서비스를 만들고 프로비전하는 데 사용됩니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다.
Java용 Azure SDK com.azure.search.documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다.

com.microsoft.azure.management.search 는 Azure Resource Manager를 통해 서비스를 만들고 프로비전하는 데 사용됩니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다.
Python용 Azure SDK azure-search-documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다.

azure-mgmt-search 는 Azure Resource Manager를 통해 서비스를 만들고 프로비전하기 위한 것입니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다.
JavaScript/TypeScript용 Azure SDK azure/search-documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다.

azure/arm-search 는 Azure Resource Manager를 통해 서비스를 만들고 프로비전하기 위한 것입니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다.