다음을 통해 공유


데이터 보안 조사 AI 분석에 대해 알아보기(미리 보기)

중요

데이터 보안 조사 organization 데이터 분석에서 AI(생성 인공 지능), 대규모 언어 모델 및 오케스트레이션을 사용합니다. AI에서 생성된 결과가 항상 정확하거나 완전하지는 않을 수 있습니다. 신뢰할 수 있고 유용한 정보를 제공하기 위해 노력하는 동안 AI 시스템은 올바르지 않거나 잘못된 결과를 생성할 수 있습니다. 정보를 확인하고 주의해서 사용하는 것이 중요합니다. Microsoft는 AI 시스템에서 제공하는 정보에 대해 명시적, 묵시적 또는 법적 보증을 하지 않습니다.

데이터 보안 조사(미리 보기)는 AI 서비스 및 도구를 사용하여 보안 인시던트와 관련된 항목을 신속하게 검토하고 조치를 취할 수 있도록 지원합니다. AI 관련 서비스에는 다음 도구가 포함됩니다.

  • 벡터 검색
  • 분류
  • 시험

데이터 보안 조사 벡터 검색(미리 보기)을 사용하면 고급 오케스트레이션 및 포함을 사용하여 조사 scope 추가하는 데이터를 컨텍스트별로 검색할 수 있습니다. 벡터 검색은 단순히 키워드를 일치시키는 것이 아니라 쿼리에서 단어와 구 뒤에 있는 의미와 컨텍스트를 이해하는 데 중점을 둔 검색 엔진 기술입니다.

벡터 검색의 몇 가지 주요 측면은 다음과 같습니다.

  • 컨텍스트 이해: 벡터 검색은 organization, 검색 기록 및 쿼리의 전반적인 의미와 같은 요소를 고려하여 검색어의 컨텍스트를 해석합니다.

  • 의도 인식: 벡터 검색은 정보를 찾고, 작업을 수행하거나, 검색과 관련된 특정 유형의 콘텐츠를 찾는 등 의도를 이해하기 위해 작동합니다.

  • 관련성 및 정확도: 의미 체계(쿼리에서 단어의 의미와 의도)에 집중하여 벡터 검색은 보다 정확하고 관련성이 높은 결과를 제공하고 전체 검색 환경을 개선합니다.

  • 추천 검색(미리 보기): 벡터 검색을 사용하면 조사 컨텍스트 또는 조사의 이전 검색에 따라 선택할 수 있는 사용자 지정된 추천 검색 쿼리도 사용할 수 있습니다. 조사에 컨텍스트가 정의되어 있지 않고 이전 검색이 없는 경우 다음 기본 제안된 검색 중에서 선택할 수 있습니다.

    • 자격 증명 또는 암호가 포함된 항목을 찾습니다.
    • 중요한 정보가 포함된 모든 콘텐츠 찾기
    • 모든 법률 및 재무 문서 나열

organization 조사자가 손상된 데이터 집합을 조사할 때 데이터 보안 조사(미리 보기)의 벡터 검색은 다음과 같은 몇 가지 주요 과제를 해결하여 조사를 크게 향상시킬 수 있습니다.

  • 관련 정보 식별: 벡터 검색은 쿼리의 컨텍스트와 의도를 이해합니다. 이 포커스를 사용하면 사용한 정확한 키워드가 없는 경우에도 관련 문서, 전자 메일 또는 레코드를 빠르게 찾을 수 있습니다.
  • 모호성 처리: 벡터 검색은 여러 의미가 있는 용어를 명확하게 구분하여 조사에 컨텍스트적으로 적절한 결과를 얻을 수 있도록 합니다.
  • 노이즈 감소: 벡터 검색은 관련 없는 정보를 필터링하여 가장 관련성이 큰 데이터에 집중할 수 있도록 하고 관련 없는 결과를 선별하는 데 소요되는 시간을 줄입니다.
  • 효율성 향상: 벡터 검색은 검색 프로세스를 간소화하여 가장 관련성이 높은 정보를 빠르게 표시하여 조사를 보다 효율적이고 효과적으로 만듭니다.

작동 방법

조사를 만들고, scope 정의하고, AI에 대한 데이터를 준비하면 데이터 집합에 대한 벡터 검색을 실행할 수 있습니다. 프로세스의 이전 단계에서는 간단한 키워드(keyword), 메타데이터 및 날짜 범위 검색을 허용하지만 벡터 검색은 AI 포함을 사용하여 데이터를 컨텍스트적으로 검색합니다. 이 프로세스를 통해 조사자는 정확한 내용을 알지 못하고 항목을 찾을 수 있습니다.

중요

텍스트가 포함된 항목만 벡터화됩니다. 이미지 파일, 이미지만 포함된 전자 메일, 모임 초대 및 일정 알림은 제외됩니다.

벡터 검색은 먼저 AI 포함 모델을 통해 조사에서 범위가 지정된 모든 데이터를 실행하는 방식으로 작동합니다. 이 모델은 데이터 세트의 모든 항목에서 의미 체계적 의미를 추출하고 더 작은 부분으로 나눕니다. 이 프로세스를 포함이라고 하며 데이터 보안 조사(미리 보기)에서 차원 값을 사용하여 데이터를 컨텍스트적으로 이해할 수 있습니다. 의미 체계 검색 인덱스는 쿼리할 수 있는 이러한 값으로 빌드됩니다.

조사에서 벡터 검색 쿼리를 만들면 AI는 자동으로 쿼리를 확장 및 확대하고 의미 체계 검색 인덱스를 통해 쿼리를 실행합니다. 데이터 보안 조사(미리 보기)는 쿼리의 의미 체계 의미를 콘텐츠의 의미 체계적 의미와 일치시키고 모든 컨텍스트 관련 항목을 반환합니다.

예를 들어 "Contoso Security 프로젝트에 포함된 기밀 데이터"를 검색하는 경우 벡터 검색 엔진은 검색 쿼리에 포함된 키워드(기밀, 데이터, Contoso 등)를 단순히 일치시키는 대신 이 특정 프로젝트에서 기밀데이터를 찾고 있음을 이해합니다. 벡터 검색을 사용하면 키워드가 누락된 경우에도 영향을 받는 데이터를 쿼리하여 특정 주체와 관련된 모든 데이터 항목을 찾을 수 있습니다.

또한 검색 관련성 점수는 반환되는 각 항목에 자동으로 할당됩니다. 검색 관련성 점수를 사용하면 검색과 벡터 검색으로 식별된 항목 간의 연결 신뢰도 수준을 빠르게 확인할 수 있습니다.

벡터 검색 개념에 대한 자세한 내용은 Azure AI Search의 벡터 문서의 개념 섹션을 참조하세요.

AI를 사용하여 검색(미리 보기)

벡터 검색을 기반으로 하는 AI를 사용한 검색(미리 보기) 은 RAG(검색 보강 세대) 기능을 통합하고 검색 결과 모델을 최적화합니다. 이 기능에는 항목 파일 형식, 크기, 버전 등을 기반으로 관련 항목 검색이 포함됩니다.

벡터 검색에 대한 이 기능 확장에는 검색이 요구 사항을 충족하는지 신속하게 평가하는 데 도움이 되는 특정 검색 결과 샘플에 대한 인용 링크를 포함하여 검색에 반환된 개별 항목을 기반으로 하는 검색 요약도 포함됩니다.

데이터 보안 조사 AI를 사용하여 검색(미리 보기).

분류

organization 위반되고 영향을 받은 데이터를 식별할 때 조사관은 데이터의 우선 순위를 지정하여 보안 위험 식별을 시작해야 합니다. 데이터 보안 조사(미리 보기)의 범주는 크고 복잡한 조사 범위의 항목에 범주를 수동으로 할당할 필요가 없습니다.

데이터 보안 조사(미리 보기)에서 AI 기반 분류를 사용하여 잠재적으로 영향을 받은 데이터를 보다 신속하게 추론하고 우선 순위를 지정할 수 있습니다. 데이터를 분류하려면 전체 또는 일부 기본 범주 옵션을 선택하거나, 조사에 따라 AI 추천 범주를 사용하거나, 고유한 사용자 지정 범주를 만들 수 있습니다.

AI에서 생성된 범주는 scope 주체 수준 콘텐츠에 대한 추가 정보로 보강됩니다.

  • 이름: 콘텐츠에 따라 범주 또는 영역의 이름입니다.
  • 요약: 기본 콘텐츠에 대한 간단한 설명

각 범주 내에서 모든 콘텐츠에서 벡터 검색 및 검사 도구를 사용할 수 있습니다.

기본 범주

데이터 보안 조사(미리 보기)에는 조사 scope 항목을 분류하는 기본 범주가 포함됩니다. 분류를 실행할 때 모든 기본 범주 또는 검토 scope 적용되는 기본 범주만 선택할 수 있습니다. 분석은 선택되지 않은 기본 범주를 무시하고 이러한 범주에 대한 결과를 검토할 수 없습니다.

AI 처리는 콘텐츠 항목에 대한 초기 기본 범주를 결정합니다.

  • 비즈니스 정보: 일반 비즈니스 정보입니다. 이 범주에는 일반적으로 많은 수의 항목이 포함됩니다. 이 범주의 몇 가지 예제 영역에는 디지털 참여 및 분석, 사용자 및 인사, 일상적인 관리 통신, 고객 참여/경험 등이 포함될 수 있습니다.
  • 통신 레코드: 일반 통신 정보입니다. 이 범주에는 일반적으로 많은 수의 항목이 포함됩니다. 이 범주를 사용하여 통신 영역을 기반으로 조사를 확인합니다. 이 범주의 일부 예제 영역에는 클라이언트 불만, 휴일 인사말, 내부 메모, 프로젝트 업데이트 등이 포함될 수 있습니다.
  • 자격 증명 및 액세스 정보: 조사에서 자산 액세스와 관련된 정보입니다. 이 정보는 organization 잠재적으로 위험한 데이터 및 통신을 식별하는 데 도움이 됩니다. 이 범주의 일부 예제 영역에는 사용자 자격 증명, 무단 데이터베이스 액세스, 데이터 노출 등이 포함될 수 있습니다.
  • 고객 정보: 고객과 공유된 정보입니다. 이 범주를 사용하여 위험에 처한 고객 데이터를 파악합니다. 이 범주의 몇 가지 예제 영역에는 결제 확인, 고객 환경 개선, 배달 정보 등이 포함될 수 있습니다.
  • 사용자 정보: organization 사용자와 관련된 정보입니다. 이 범주에는 일반적으로 많은 수의 항목이 포함됩니다. 이 범주의 일부 예제 영역에는 사용자 고용 정보, 사용자 보존 전략, 특수 그룹 멤버 자격 등이 포함될 수 있습니다.
  • 재무 정보: 조사의 재무 정보입니다. 이 범주의 몇 가지 예제 영역에는 재무 계획, 기회 부여, 예산, 재무제표 등이 포함될 수 있습니다.
  • 상태 정보: 조사의 상태 및 의료 관련 항목입니다. 이 범주의 일부 예제 영역에는 웰빙 및 건강 기록, COVID-19 안전 프로토콜 업데이트, 상태 클레임 및 인시던트 보고서 등이 포함될 수 있습니다.
  • 인시던트 및 조사 정보: 조사의 인시던트 및 조사에 대한 항목입니다. 이 범주에는 organization 내의 보안 인시던트 및 조사가 포함됩니다. 이 범주의 일부 예제 영역에는 데이터 위반, 상태 레코드 인시던트, 고위험 클라이언트 계정 모니터링 등이 포함될 수 있습니다.
  • 지적 재산권: 조사의 IP(지적 재산권) 데이터입니다. 이 범주의 몇 가지 예제 영역에는 향후 특허 출원, 연구 개발 작업, 실험 결과 메트릭 등이 포함될 수 있습니다.
  • 마케팅 정보: 조사 중인 마케팅 데이터입니다. 이 범주의 일부 예제 영역에는 보도 자료, 광고 캠페인, 마케팅 및 판매 계획 또는 전략 등이 포함될 수 있습니다.
  • 운영 정보: organization 운영 데이터입니다. 이 범주의 일부 예제 영역에는 물류, 배송, 재고, 규정 준수, 세금 기록 등이 포함될 수 있습니다.
  • 개인 식별 정보: 조사에서 개인 데이터 및 관련 항목을 그룹화합니다. 이 범주의 일부 예제 영역에는 이벤트 게스트 목록, 직원 및 교육 세션, 직원 개인 정보 등이 포함될 수 있습니다.
  • 규제된 데이터: 조사에서 규제된 데이터입니다. 이 범주의 몇 가지 예제 영역에는 규정, 데이터 보호, 규정 레코드 등이 포함될 수 있습니다.

추천 범주

또한 데이터 보안 조사(미리 보기)는 조사 scope 분석된 콘텐츠를 기반으로 AI에서 생성된 추천 범주를 제공합니다. 이러한 제안된 범주는 조사가 예기치 않거나 알 수 없는 영역으로 그룹화된 항목을 검토하는 데 자동으로 도움이 됩니다. 포함된 콘텐츠 유형에 따라 제안된 범주가 달라집니다.

분석된 콘텐츠가 주로 기본 범주 영역 외부의 특정 주제 영역에 중점을 두는 경우 제안된 범주는 해당 특정 콘텐츠 영역으로 사용자 지정됩니다. 예를 들어 분석된 콘텐츠가 organization 전용인 용어 및 개념이 있는 기밀 주제에 중점을 두면 이러한 영역에 대해 제안된 범주가 자동으로 만들어집니다. 이러한 범주는 organization 분석된 콘텐츠에 고유합니다.

사용자 지정 범주

데이터 보안 조사(미리 보기)를 사용하면 콘텐츠를 분석할 때 사용할 생성 AI 프로세스에 대한 사용자 지정 범주를 수동으로 만들 수 있습니다. 조사 요구 사항에 가장 적합한 범주를 정의하여 시간을 절약하고 AI 프로세스가 이러한 사용자 지정 범주에 따라 항목을 자동으로 분류하도록 할 수 있습니다.

사용자 지정 범주는 조사 중에 관심 있는 콘텐츠의 특정 특성을 캡처하는 특정 단어 또는 구일 수 있습니다. 예를 들어 사용자 지정 범주에는 보안 취약성, 버그 수정, 특정 프로젝트 코드 이름 또는 특정 의약품 또는 약물 후보와 관련된 R&D와 같은 사용자 지정 지적 재산권이 포함될 수 있습니다.

조사에 도움이 될 수 있는 몇 가지 추가 사용자 지정 범주:

  • 액세스 코드
  • API 액세스 설명서
  • API 인증 키
  • API 토큰
  • 응용 프로그램 구성 파일
  • CA(인증 기관) 세부 정보
  • 인증서
  • 데이터베이스 자격 증명
  • 디지털 인증서
  • 재해 복구 계획
  • 직원 위치 데이터
  • 암호화 키
  • 환경 구성 파일
  • 인시던트 관리 로그
  • 통합 토큰
  • JWT 토큰
  • 키 관리 정책
  • MFA(다단계 인증) 백업 코드
  • PIN(개인 식별 번호)
  • 권한 있는 계정 세부 정보
  • 보안 문자열
  • 보안 로그
  • 보안 정책
  • 세션
  • SSH 프라이빗 키
  • 타사 API 비밀
  • 사용자 자격 증명
  • 취약성 평가

시험

심층 분석이 필요한 항목을 식별할 때 데이터 보안 조사(미리 보기)는 주요 보안 및 중요한 데이터 위험에 집중하는 데 도움이 되는 AI 기반 검사 기능을 제공합니다.

  • 자격 증명: 이 검사 포커스 영역을 사용하여 조사 scope 선택한 모든 항목에서 자격 증명을 검사하고 추출합니다. 이 정보는 조사자에게 보안 인시던트와 연결된 계정 및 자격 증명을 빠르게 이해할 수 있는 방법을 제공하며 잠재적으로 유출될 수 있습니다.

  • 위험: 조사자가 조사에 집중하고 우선 순위를 지정하는 데 도움이 되도록 이 검사 포커스 영역을 사용하여 선택한 파일의 모든 위험 영역을 채점합니다. 이 도구는 항목이 권한 있는 콘텐츠인 경우 각 항목에 대한 전반적인 위험과 항목에 대한 기타 특정 위험을 제공합니다.

    위험 영역 유형은 다음과 같습니다.

    • 자산 식별자
    • 자격 증명 및 비밀
    • 위협 행위자 토론 위반 토론의 증거
    • 긴급 보안 인시던트
    • 취약성 및 보안 예방 조치
    • 개인 및 중요한 콘텐츠
    • 네트워크 및 액세스 정보
    • 정책 준수 및 데이터 보호
    • 인프라 정보
    • 고객 정보
    • 정부 정보
    • 권한 있는 정보
    • 영업 비밀
  • 완화: 이 검사 포커스 영역을 사용하여 선택한 파일에 대한 위험 점수를 매기고 데이터 보안 조사(미리 보기)를 사용하여 다음에 수행할 작업에 대한 완화 지침을 제공할 수 있습니다. 선택한 파일은 위험 점수, 위험 요약 및 자세한 완화 권장 사항을 가져와 콘텐츠 위반으로 인한 더 많은 피해를 방지합니다.

AI 분석 권장 사항

다음 표에서는 데이터 보안 조사(미리 보기)에서 AI 분석 도구를 사용할 때 권장 사항, 예제 시나리오 및 모범 사례를 간략하게 설명합니다.

추천 벡터 검색 분류 시험
사용 시기 벡터화된 데이터 세트(청구서, 버그 수정 등) 내의 특정 항목에 대한 예제를 찾아 확인 및 추가 조사 가설을 확인합니다.

빠른 대화형 분석을 위해 벡터 검색을 사용하면 결과가 빠르게 채워집니다.
많은 양의 데이터를 기본, 사용자 지정 또는 AI 생성 범주로 빠르게 정렬하여 민감도 및 심각도에 따라 조사 포커스의 우선 순위를 지정합니다.

데이터 집합의 크기에 따라 분류를 완료하는 데 다소 시간이 걸릴 수 있습니다.
범위가 지정된 데이터 집합의 항목 수준에서 대상 분석을 수행하면 다음 단계를 위해 확인된 데이터 자산에서 인사이트를 추출하는 데 도움이 됩니다.

검사를 사용하여 완화할 항목을 식별합니다.
예제 시나리오 잠재적으로 사기성 활동의 평가. 대규모 위반 후 분석을 위한 항목의 우선 순위 지정 유효성이 검사된 데이터 집합 및 권장 완화 단계에서 자격 증명 추출
모범 사례 관심 있는 항목을 벡터화된 모든 콘텐츠에서 검색하여 더 의미 있는 AI 추천 범주를 생성합니다. 하나 이상의 범주를 선택하고 벡터 검색을 사용하여 범주 내에서 검색합니다.

각 범주 내에서 AI 생성 영역을 검토하여 데이터 집합 내의 특정 콘텐츠를 이해합니다.
검사를 사용하여 민감도가 높은 특정 항목을 자세히 조사하여 개별 점수와 결과를 가져옵니다.

시작할 준비가 되셨나요?