다음을 통해 공유


연결 마법사(Excel용 데이터 마이닝 클라이언트)

데이터 마이닝 리본의 연결 마법사

연결 마법사를 사용하면 Microsoft 연결 규칙 알고리즘을 사용하여 데이터 마이닝 모델을 만들 수 있습니다. 이러한 마이닝 모델은 권장 사항 시스템을 만드는 데 특히 유용합니다.

작동 방식은 Microsoft 연결 규칙 알고리즘이 트랜잭션 또는 이벤트로 구성된 데이터 세트를 검색하고 자주 함께 표시되는 조합을 찾는 것입니다. 수천 개의 조합이 있을 수 있지만 알고리즘을 사용자 지정하여 더 많거나 적게 찾고 가장 가능성이 큰 조합만 유지할 수 있습니다.

많은 문제에 연결 분석을 적용할 수 있습니다. 이 방법의 가장 인기있는 응용 프로그램은 종종 함께 구입 개별 제품을 찾는 시장 바구니 분석입니다. 그런 다음, 해당 정보를 사용하여 이미 구입한 항목을 기반으로 고객에게 제품을 추천할 수 있습니다.

연결 마법사 사용

  1. 데이터 마이닝 리본에서 연결을 클릭합니다.

  2. 원본 데이터 선택 페이지에서 Excel 테이블 또는 데이터 범위를 선택하고 다음을 클릭합니다.

    샘플 데이터 통합 문서에는 예를 들어 각 트랜잭션에 여러 제품이 있거나 분석하려는 고객당 여러 구매 레코드가 있는 경우 일반적으로 트랜잭션 데이터가 정렬되는 방법에 대한 예제가 연결 탭에 포함되어 있습니다.

    외부 데이터를 사용하여 연결 마법사를 사용하여 연결 모델을 빌드하려면 먼저 Excel에 데이터를 추가하고 데이터를 평면화 해야 합니다. 연결 모델링을 위해 데이터를 준비하는 방법에 대한 자세한 내용은 SQL Server 온라인 설명서에서 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.

  3. 연결 페이지에서 트랜잭션을 식별하는 열을 선택합니다.

    시장 바구니 모델의 경우 이 식별자는 모델링하려는 단위를 나타냅니다. 개별 고객이 시간이 지남에 따라 구매한 항목을 분석하시겠습니까, 아니면 여러 고객과 관련된 많은 트랜잭션을 분석하시겠습니까? 첫 번째 경우 고객 ID를 선택합니다. 후자의 경우 구매 주문 또는 기타 트랜잭션 ID를 선택합니다.

  4. 항목의 경우 연결을 찾아야 하는 항목이 포함된 열을 선택합니다.

    예를 들어 시장 바구니 모델에서 제품 필드를 선택하여 함께 구매하는 제품을 분석합니다. 개별 제품이 너무 많아 효과적으로 상호 연결되지 않는 경우 제품 범주 또는 하위 범주 필드를 선택할 수 있습니다.

  5. 임계값에서 모델의 출력을 제어하거나 영향을 주는 값을 설정할 수 있습니다.

    • 최소 지원. 항목 그룹이 중요한 것으로 간주되어야 하는 횟수를 지정합니다. 알고리즘은 이 조건을 충족하지 않는 항목 조합을 무시합니다. 예를 들어 항목이 총 10번 이상 함께 나타난 항목 집합만 보고 싶을 수 있습니다.

    • 최소 규칙 확률입니다. 규칙을 저장하는 데 필요한 최소 확률 값을 지정합니다. 전체 데이터 집합을 분석하여 모든 조합을 찾은 다음 확률을 계산합니다. 임계값이 낮으면 마법사는 느슨하게 상호 연결된 항목만 연결할 수 있습니다. 임계값이 너무 높으면 지원 데이터가 충분하지 않아 일부 연결이 생략될 수 있습니다.

    일반적으로 이러한 값을 변경하면 다음과 같은 효과가 있습니다.

    • 지원 값을 낮추면 찾은 조합의 수가 늘어나게 됩니다.

    • 최대 지지를 줄이면 너무 자주 발생하여 의미가 거의 없는 항목을 제거합니다.

    • 규칙의 확률을 낮추면 전체 데이터 집합의 컨텍스트에서 중요한 것으로 간주하기 위해 조합이 충족해야 하는 요구 사항을 낮춥니다.

    팁: 다양한 지원 및 확률 조합을 사용하여 여러 마이닝 모델을 만드는 것이 좋습니다. 각 모델에 사용한 설정을 추적하려면 Excel용 데이터 마이닝 클라이언트에서 사용할 수 있는 문서 모델 마법사를 사용하고 자세한 보고서 옵션을 사용할 수 있습니다. 자세한 내용은 마이닝 모델 문서화(Excel용 데이터 마이닝 추가 기능)를 참조하세요.

  6. 필요에 따라 매개 변수 를 클릭하여 알고리즘 매개 변수를 변경하고 마이닝 모델의 동작을 사용자 지정합니다.

    알고리즘 매개 변수 대화 상자에는 마법사에서 설정한 모든 매개 변수와 MAXIMUM_SUPPORT 같이 덜 일반적으로 사용되는 몇 가지 매개 변수가 포함됩니다. 이러한 매개 변수를 사용하는 방법에 대한 자세한 내용은 Microsoft 연결 알고리즘 기술 참조를 참조하세요.

  7. 마침 페이지에서 데이터 집합 및 모델의 고유한 이름을 입력합니다.

  8. 옵션에서 모델을 완료한 후 작업하는 방법을 정의합니다.

    • 찾아보기. 모델이 준비되면 마법사는 규칙, 항목 집합 및 연결을 보여 주는 종속성 네트워크 그래프를 표시하는 창을 엽니다.

      연결 모델 뷰어에서 데이터를 해석하는 방법에 대한 자세한 내용은 연결 규칙 모델 찾아보기를 참조하세요.

    • 드릴스루를 사용하도록 설정합니다. 모델을 통해 기본 데이터에 액세스하려면 이 옵션을 선택합니다.

      예를 들어 특정 항목 집합을 클릭하고 원본 데이터를 확인하려는 경우 드릴스루가 유용합니다.

    • 임시 모델을 사용합니다. 모델을 서버에 저장하지 않으려면 이 옵션을 선택합니다. Excel을 닫으면 임시 모델이 삭제됩니다.

  9. 마법사는 가능한 모든 조합을 분석하고 항목 집합 및 규칙을 포함하는 보고서를 만듭니다.

연결 모델에 대한 자세한 정보

Microsoft 연결 규칙 알고리즘은 학습 데이터를 검사하여 트랜잭션에 함께 표시되는 항목을 찾습니다. 각 항목 그룹은 항목 집합을 구성합니다. 그런 다음 알고리즘은 각 항목 집합이 표시되는 횟수를 계산하고 모든 트랜잭션에서 각 항목 집합의 상대적 중요도를 계산합니다.

알고리즘은 항목 집합에 대한 이 정보를 사용하여 연결을 예측하거나 권장 사항을 만드는 데 사용할 수 있는 규칙을 생성합니다. 예를 들어 규칙은 "사용자가 Author 1의 책과 Author 2의 책을 구입한 경우 사용자가 Author 3의 책도 구매할 가능성이 높습니다."가 될 수 있습니다. 각 권장 사항에는 연결의 강도에 따라 확률이 할당됩니다.

요구 사항

연결 마법사를 사용하려면 Analysis Services 데이터베이스에 연결해야 합니다.

원본 데이터는 트랜잭션 테이블로 구성되어야 합니다. 원본 데이터는 트랜잭션 식별자를 포함하는 하나의 열을 포함해야 합니다. 이 열은 각 항목 그룹을 식별합니다. 해당 트랜잭션 열은 그룹의 개별 항목에 대한 이름 또는 ID 번호를 저장하는 항목 ID인 두 번째 열과 일대다 관계에 있어야 합니다.

개념적으로 이것은 장바구니 예제를 상기함으로써 가장 쉽게 이해될 수 있습니다. 쇼핑 카트에 ID가 할당된 경우 쇼핑 카트 ID는 트랜잭션의 식별자로 사용됩니다. 감자 또는 우유와 같은 쇼핑 카트의 각 항목은 해당 거래의 구성원입니다. 연결 알고리즘은 트랜잭션 간에 항목을 추적할 수 있습니다. 예를 들어 단일 트랜잭션 내에 감자와 우유가 나타나는 횟수를 결정할 수 있습니다.

원본 데이터는 트랜잭션 식별자 열별로 정렬되어야 합니다.

또한 참조하십시오

데이터 마이닝 모델 만들기
연관 규칙 모델 찾아보기
장바구니 분석(Excel용 Table AnalysisTools)
종속성 네트워크 다이어그램 연습(데이터 마이닝 추가 기능)