클러스터 마법사(Excel용 데이터 마이닝 추가 기능)

데이터 마이닝 리본의 클러스터 마법사

클러스터 마법사를 사용하면 비슷한 특성을 공유하는 행을 검색하고 그룹화하여 그룹 간 거리를 최대화하는 모델을 빌드할 수 있습니다. 이 마법사는 모든 종류의 데이터에서 패턴을 찾는 데 유용합니다.

클러스터 마법사는 Microsoft 클러스터링 알고리즘을 사용하며 광범위하게 사용자 지정할 수 있습니다. Excel 테이블, Excel 범위 또는 Analysis Services 쿼리의 기존 데이터에서 작동합니다. Excel용 테이블 분석 도구에 제공된 범주 검색 도구에서도 비슷한 기능이 제공됩니다. 그러나 범주 검색 도구는 사용자 지정할 수 없으며 Excel 테이블에서 데이터를 사용해야 합니다.

클러스터 마법사 사용

데이터 마이닝 리본에서 클러스터를 클릭한 다음 다음을 클릭합니다.
원본 데이터 선택 페이지에서 Excel 테이블 또는 범위를 선택합니다. 또는 외부 데이터 원본을 지정합니다.

외부 데이터 원본을 사용하는 경우 사용자 지정 보기를 만들거나 사용자 지정 쿼리 텍스트에 붙여넣고 데이터 집합을 Analysis Services 데이터 원본으로 저장할 수 있습니다.
클러스터링 페이지에서 모델을 빌드하는 방법을 사용자 지정할 수 있습니다.
- 세그먼트 수의 경우 마법사에 고정된 개수의 범주를 만들거나 최적의 그룹화를 자동으로 검색하도록 할 수 있습니다.
- 입력 열 목록에서 열 목록을 검토하고 패턴을 만드는 데 유용하지 않은 열을 선택 취소합니다. 제외해야 하는 열에는 ID 번호, 고객 이름 등이 포함됩니다.
필요에 따라 매개 변수 를 클릭하여 알고리즘 매개 변수를 변경하고 클러스터링 모델의 동작을 사용자 지정합니다.
학습 및 테스트 집합으로 데이터 분할 페이지에서 테스트를 위해 보유할 데이터의 양을 지정합니다. 나머지는 항상 모델을 학습하는 데 사용됩니다.

기본 설정은 30% 테스트 데이터 및 70% 학습 데이터입니다.
마침 페이지에서 데이터 집합 및 모델에 대한 설명이 포함된 이름을 제공하고 완성된 모델에서 작업하는 방법을 제어하는 다음 옵션을 설정합니다.
- 모델 검색 이 옵션을 선택하면 마법사가 모델 처리를 마치자마자 결과를 탐색하는 데 도움이 되는 찾아보기 창이 열립니다. 뷰어의 내용은 빌드한 모델 유형에 따라 달라집니다. 자세한 내용은 클러스터링 모델 찾아보기를 참조하세요.
- 드릴스루를 사용하도록 설정합니다. 완성된 모델에서 기본 데이터를 보려면 이 옵션을 선택합니다. 이 옵션은 의사 결정 트리 모델을 빌드하는 경우에만 사용할 수 있습니다.
- 임시 모델을 사용합니다. 이 옵션을 선택하면 모델이 서버에 저장되지 않습니다. Excel을 닫으면 임시 모델이 삭제됩니다.

클러스터링 모델에 대한 자세한 정보

고급을 클릭하고 알고리즘 매개 변수 대화 상자를 사용하여 이 마법사에서 사용하는 클러스터링 알고리즘을 변경할 수 있습니다.

Microsoft 클러스터링 알고리즘은 다음과 같은 클러스터링 방법을 제공합니다.

K-평균 - 확장 가능 또는 비 스케일링.
EM(Expectation Maximization) - 확장 가능하거나 비 스케일링입니다.

또한 CLUSTER_SEED 매개 변수를 사용하여 시작 값을 제어하고 동일한 데이터 집합을 사용하는 반복되는 모델에 동일한 결과가 있는지 확인할 수 있습니다.

요구 사항

클러스터 마법사를 사용하려면 Analysis Services 데이터베이스에 연결해야 합니다. 자세한 내용은 원본 데이터에 연결(Excel용 데이터 마이닝 클라이언트)을 참조하세요.

또한 참조하십시오

데이터 마이닝 모델 만들기
범주 검색(Excel용 테이블 분석 도구)

Last updated on 2017-12-29