다음을 통해 공유


앱 콘텐츠 검색 개요

Windows AI API에서 사용하도록 설정된 앱 콘텐츠 검색 기능을 통해 앱 개발자는 AppContentIndexer API를 사용하여 지능형 검색 기능을 Windows 앱에 통합할 수 있습니다. 앱 내 콘텐츠를 인덱싱하고 의미 체계 쿼리를 통해 검색할 수 있게 함으로써 사용자는 정확한 키워드뿐만 아니라 의미 체계적 의미에 따라 결과를 검색할 수 있습니다. 이 의미 체계 인덱스를 사용하여 도메인별 지식으로 사용자 고유의 AI 도우미를 향상시켜 보다 개인화된 컨텍스트별 환경을 만들 수 있습니다.

이 API를 사용하여 다음을 수행합니다.

  • 의미 체계 및 어휘 검색을 모두 사용하는 앱 내 검색 환경을 빌드합니다. 사용자는 정확한 키워드 일치 외에도 의미에 따라 검색할 수 있으므로 관련 정보를 더 쉽게 찾을 수 있습니다.

  • 로컬 정보 검색 기능을 활성화하여 Retrieval-Augmented 생성(RAG)을 지원합니다. LLM(큰 언어 모델)과 쌍을 이루면 앱의 기술 자료에서 가장 관련성이 큰 콘텐츠를 검색하고 보다 정확하고 컨텍스트 인식 응답을 생성할 수 있습니다.

ApplicationContentIndexer API는 현재 Windows 앱 SDK 릴리스 2.0 실험 2에서만 사용할 수 있습니다.

AI 개발자 갤러리 앱은 AppContentIndexer API의 대화형 샘플을 제공하여 앱 콘텐츠 검색 기능을 실험할 수 있도록 합니다. Microsoft Store 또는 GitHub의 소스 코드에서 설치하는 방법을 포함하여 AI 개발자 갤러리에 대해 자세히 알아봅니다.

AppContentIndexer API란?

AppContentIndexer API를 사용하면 개발자가 기본 복잡성을 이해할 필요 없이 앱이 키워드 기반(어휘) 및 의미 기반(의미 체계) 검색을 모두 사용하여 텍스트 및 이미지 콘텐츠를 검색할 수 있도록 할 수 있습니다.

백그라운드에서는 벡터 포함, 벡터 데이터베이스 및 기존 텍스트 인덱싱과 같은 고급 기술을 사용하지만 이러한 세부 정보는 완전히 추상화됩니다. 개발자는 간단하고 높은 수준의 API와 상호 작용합니다. 콘텐츠가 인덱싱되면 시스템은 콘텐츠 식별자와 함께 포함 벡터(의미 체계 의미를 캡처)를 저장합니다. 그런 다음 검색 요청은 키워드 일치 또는 의미 체계 유사성에 따라 식별자를 반환합니다. 예를 들어 "새끼 고양이"를 검색하면 고양이 또는 새끼 고양이 이미지에 대한 관련 텍스트가 반환될 수 있습니다. 시맨틱 검색은 설명적인 어구와 함께 사용할 때 가장 효과적이므로 "창턱에 앉아 있는 고양이"와 같은 쿼리는 관련성이 높은 결과를 생성할 가능성이 높습니다.

인덱스는 디스크에 유지되므로 각 앱 시작 시 다시 인덱싱이 필요하지 않습니다.

내부적으로 ApplicationContentIndexer는 기존 텍스트 인덱싱과 포함으로 구동되는 최신 벡터 기반 검색의 조합을 사용합니다. 이러한 세부 정보는 추상화되지 않습니다. 개발자는 포함 모델, 벡터 스토리지 또는 검색 인프라를 직접 관리할 필요가 없습니다.

일반 문자열을 사용하여 인덱스 쿼리를 수행할 수 있습니다. 쿼리는 다음을 반환할 수 있습니다.

  • 어휘 일치 – 정확한 텍스트 일치(이미지 내에서 찾은 텍스트 포함)
  • 의미 체계 일치 - 단어가 동일하지 않더라도 의미와 유사한 콘텐츠입니다.

예를 들어 "kitten"에 대한 쿼리는 다음 참조를 반환할 수 있습니다.

  • "새끼 고양이"라는 단어가 명시적으로 언급되지 않더라도 고양이에 대한 텍스트 항목입니다.
  • 시각적으로 새끼 고양이를 포함하는 이미지.
  • 'cat' 또는 의미적으로 관련성이 있는 단어가 포함된 이미지에서의 문자 내용입니다.

지원하는 콘텐츠 유형

ApplicationContentIndexer는 다음 형식의 콘텐츠 추가를 지원합니다.

  • 텍스트 – 일반 또는 구조화된 텍스트 콘텐츠입니다.
  • 이미지 - 텍스트 또는 인식할 수 있는 시각적 요소가 포함된 스크린샷, 사진 또는 이미지 파일을 포함합니다.

앱 정의 콘텐츠 식별자

AppContentIndexer 는 앱에서 앱 정의 콘텐츠 식별자를 사용하여 항목을 인덱싱할 수 있도록 하여 앱 관리 콘텐츠를 지원합니다. 쿼리는 앱이 자체 데이터 저장소에서 실제 콘텐츠를 검색하는 데 사용하는 이러한 식별자를 반환합니다.

텍스트 쿼리는 AppManagedTextQueryMatch 개체를 반환하고, 이미지 쿼리는 AppManagedImageQueryMatch 개체를 반환하며 콘텐츠 자체가 아닌 ContentId만 포함합니다.

이 기능을 앱에 통합하고 ApplicationContentIndexer API를 사용하는 방법에 대한 지침은 다음을 참조하세요. 빠른 시작: 앱 콘텐츠 검색

개인 정보 및 보안

의미 체계 및 어휘 인덱스는 앱을 대신하여 생성되고 앱의 로컬 앱 데이터 폴더에 저장됩니다. 프라이빗 미리 보기 릴리스의 일부로 이 기능은 민감하지 않은 애플리케이션 콘텐츠를 인덱싱하기 위한 것입니다. 모범 보안 사례의 경우 이 기능을 사용하여 개인, 기밀 또는 중요한 정보를 포함할 수 있는 사용자 데이터를 인덱싱하지 마세요.

책임 있는 AI 고려 사항

이 미리 보기의 의미 체계 인덱싱 및 검색 기능은 콘텐츠 조정 형식을 적용하지 않으며 기본 모델에서 도입된 의미 체계 편향을 감지하거나 완화하려고 시도하지도 않습니다. 개발자는 AI 기반 기능을 구현할 때 잠재적인 위험을 평가하고 관리할 책임이 있습니다.

AI 경험을 앱에 통합하는 데 있어 모범 사례를 적용하기 위해 Windows의 책임 있는 생성 AI 개발 지침을 검토하는 것을 권장합니다.