Microsoft 클러스터링 알고리즘은 유사한 특성을 포함하는 클러스터로 사례를 그룹화합니다. 이러한 그룹화는 데이터를 탐색하고, 데이터의 변칙을 식별하고, 예측을 만드는 데 유용합니다.
Microsoft 클러스터 뷰어는 클러스터링 마이닝 모델을 탐색하는 데 사용할 수 있는 다음 탭을 제공합니다.
클러스터 다이어그램 탭
클러스터 다이어그램 탭에는 마이닝 모델에 있는 모든 클러스터가 표시됩니다. 클러스터 사이의 선은 "근접성"을 나타내며 클러스터가 얼마나 유사한지에 따라 음영 처리됩니다. 각 클러스터의 실제 색은 변수의 빈도와 클러스터의 상태를 나타냅니다.
클러스터 다이어그램 탭에서 모델을 탐색하려면
마이닝 모델 뷰어 탭의 맨 위에 있는 마이닝 모델 목록을 사용하여 모델로 전환합니다
TM_Clustering.뷰어 목록에서 Microsoft 클러스터 뷰어를 선택합니다.
음영 변수 상자에서 자전거 구매자를 선택합니다.
기본 변수는 Population이지만 모델의 모든 특성으로 변경하여 원하는 특성이 있는 멤버가 포함된 클러스터를 검색할 수 있습니다.
상태 상자에서 1을 선택하여 자전거를 구입한 경우를 살펴봅니다.
밀도 범례는 음영 변수 및 상태에서 선택한 특성 상태 쌍의 밀도를 설명합니다. 이 예에서는 가장 어두운 음영을 가진 클러스터가 자전거 구매자의 비율이 가장 높다는 것을 알려줍니다.
가장 어두운 음영이 있는 클러스터 위에 마우스를 놓으세요.
도구 설명은 특성
Bike Buyer = 1이 있는 사례의 백분율을 표시합니다.밀도가 가장 높은 클러스터를 선택하고, 클러스터를 마우스 오른쪽 단추로 클릭하고, 클러스터 이름을 바꾸고 , 나중에 식별할 수 있도록 Bike Buyers High 를 입력합니다. OK를 클릭합니다.
가장 밝은 음영(및 가장 낮은 밀도)이 있는 클러스터를 찾습니다. 클러스터를 마우스 오른쪽 버튼으로 클릭한 후, 클러스터 이름 바꾸기를 선택하고 Bike Buyers Low라고 입력합니다. OK를 클릭합니다.
Bike Buyers High 클러스터를 클릭하고 다른 클러스터에 대한 연결을 명확하게 볼 수 있는 창 영역으로 끕니다.
클러스터를 선택하면 이 클러스터를 다른 클러스터에 연결하는 선이 강조 표시되므로 이 클러스터의 모든 관계를 쉽게 볼 수 있습니다. 클러스터를 선택하지 않으면 다이어그램의 모든 클러스터 간에 관계가 얼마나 강한지 선의 어둠을 알 수 있습니다. 음영이 옅거나 없는 경우 클러스터는 별로 유사하지 않습니다.
네트워크 왼쪽의 슬라이더를 사용하여 약한 링크를 필터링하고 가장 가까운 관계가 있는 클러스터를 찾습니다. Adventure Works Cycles 마케팅 부서는 대상 메일을 배달하는 가장 좋은 방법을 결정할 때 유사한 클러스터를 함께 결합하려고 할 수 있습니다.
클러스터 프로필 탭
클러스터 프로필 탭은 모델의 전체 보기를 TM_Clustering 제공합니다.
클러스터 프로필 탭에는 모델의 각 클러스터에 대한 열이 포함되어 있습니다. 첫 번째 열에는 하나 이상의 클러스터와 연결된 특성이 나열됩니다. 뷰어의 나머지 부분에는 각 클러스터에 대한 특성 상태의 분포가 포함됩니다. 불연속 변수의 분포는 히스토그램 막대 목록에 표시되는 최대 막대 수가 있는 색이 지정된 막대로 표시됩니다. 연속 특성은 각 클러스터의 평균 및 표준 편차를 나타내는 다이아몬드 차트와 함께 표시됩니다.
클러스터 프로필 탭에서 모델을 탐색하려면
히스토그램 막대를 5로 설정합니다.
모델에서 5는 하나의 변수에 대한 최대 상태 수입니다.
마이닝 범례가 특성 프로필의 표시를 차단하는 경우 해당 프로필을 이동하지 않습니다.
Bike Buyers High 열을 선택하고 인구 열의 오른쪽으로 드래그합니다.
Bike Buyers Low 열을 선택하고 Bike Buyers High 열의 오른쪽으로 끕니다.
Bike Buyers High 열을 클릭합니다.
변수 열은 해당 클러스터의 중요도 순으로 정렬됩니다. 열을 스크롤하여 Bike Buyer High 고객군의 해당 특성을 검토합니다. 예를 들어 출퇴근 시간이 짧을 가능성이 높습니다.
Bike Buyers High 열에서 Age 셀을 두 번 클릭합니다.
마이닝 레전드는 더 상세한 정보를 제공하며 이러한 고객의 연령대 및 평균 연령을 볼 수 있습니다.
Bike Buyers Low 열을 마우스 오른쪽 단추로 클릭하고 열 숨기기를 선택합니다.
클러스터 특성 탭
클러스터 특성 탭을 사용하여 클러스터를 구성하는 특성을 자세히 검사할 수 있습니다. 클러스터 프로필 탭에서처럼 모든 클러스터의 특성을 비교하는 대신 한 번에 하나의 클러스터를 탐색할 수 있습니다. 예를 들어 클러스터 목록에서 Bike Buyers High 를 선택하면 이 클러스터 에서 고객의 특성을 볼 수 있습니다. 디스플레이는 클러스터 프로필 뷰어와 다르지만 결과는 동일합니다.
비고
홀드아웃 시드에 대한 초기 값을 설정하지 않으면 모델을 처리할 때마다 결과가 달라집니다. 자세한 내용은 HoldoutSeed 요소를 참조하세요.
클러스터 차별 탭
클러스터 구분 탭을 사용하여 한 클러스터를 다른 클러스터와 구별하는 특성을 탐색할 수 있습니다. 클러스터 1 목록에서 클러스터 1개와 클러스터2 목록에서 하나씩 두 개의 클러스터를 선택한 후 뷰어는 클러스터 간의 차이를 계산하고 클러스터를 가장 구별하는 특성 목록을 표시합니다.
클러스터 차별 탭에서 모델을 탐색하려면
클러스터 1 상자에서 Bike Buyers High를 선택합니다.
클러스터 2 상자에서 Bike Buyers Low를 선택합니다.
변수를 클릭하여 사전순으로 정렬합니다.
자전거 구매자 낮음 및 자전거 구매자 높은 클러스터의 고객 들 사이에서 더 실질적인 차이 중 일부는 연령, 자동차 소유권, 어린이 수 및 지역을 포함합니다.
관련 작업
다른 마이닝 모델을 살펴보려면 다음 항목을 참조하세요.
수업의 다음 과제
Naive Bayes 모델 탐색(기본 데이터 마이닝 자습서)
수업의 이전 과제
의사 결정 트리 모델 탐색(기본 데이터 마이닝 자습서)
또한 참조하십시오
Microsoft 클러스터 뷰어를 사용하여 모델 찾아보기
클러스터 차별 탭(마이닝 모델 뷰어)
클러스터 프로필 탭(마이닝 모델 뷰어)
클러스터 특성 탭(마이닝 모델 뷰어)
클러스터 다이어그램 탭(마이닝 모델 뷰어)