다음을 통해 공유


데이터 마이닝 마법사(Analysis Services - 데이터 마이닝)

Microsoft SQL Server Analysis Services의 데이터 마이닝 마법사는 데이터 마이닝 프로젝트에 새 마이닝 구조를 추가할 때마다 시작됩니다. 이 마법사는 데이터 원본을 선택하고 분석에 사용할 데이터를 정의하는 데이터 원본 뷰를 설정한 다음 초기 모델을 만드는 데 도움이 됩니다.

마법사의 마지막 단계에서 필요에 따라 데이터를 학습 및 테스트 집합으로 나누고 드릴스루와 같은 기능을 사용하도록 설정할 수 있습니다.

시작하기 전에 알아야 할 사항

마법사를 시작하기 전에 알아야 할 사항은 다음과 같습니다.

  • 관계형 데이터베이스 또는 OLAP 데이터베이스의 기존 큐브에서 데이터 마이닝 구조 및 모델을 빌드하시겠습니까?

  • 사례 레코드를 고유하게 식별하는 키가 포함된 열은 무엇입니까?

  • 예측에 어떤 열 또는 특성을 사용하시겠습니까? 분석에 대한 입력으로 사용하기에 적합한 열 또는 특성은 무엇인가요?

  • 어떤 알고리즘을 사용해야 하나요? SQL Server Analysis Services에 제공된 알고리즘은 모두 서로 다른 특성을 가지며 다른 결과를 생성합니다. 다행히 각 데이터 집합에 대해 하나의 모델로 제한되지 않으므로 다른 모델을 추가하여 자유롭게 실험해 보세요.

  • 통합 데이터 집합에서 모델을 테스트할 수 있어야 합니까? 그렇다면 테스트를 위해 일부 데이터를 따로 설정하는 옵션을 사용하는 것이 좋습니다. 원하는 경우 백분율을 선택하고 지정된 수의 행으로 제한할 수 있습니다.

데이터 마이닝 마법사 시작

데이터 마이닝 마법사를 사용하려면 하나 이상의 데이터 마이닝 또는 OLAP 프로젝트를 포함하는 SSDT(SQL Server Data Tools)에서 솔루션을 열어야 합니다.

  • 솔루션이 데이터 마이닝에 사용할 준비가 되면 솔루션 탐색기에서 마이닝 구조 노드를 마우스 오른쪽 단추로 클릭하고 새 마이닝 구조를 선택하여 마법사를 시작할 수 있습니다.

  • 솔루션에 기존 프로젝트가 없는 경우 새 데이터 마이닝 프로젝트를 추가할 수 있습니다. 파일 메뉴에서 새로 만들기를 선택한 다음 프로젝트를 선택합니다. Analysis Services 다차원 및 데이터 마이닝 프로젝트 템플릿을 선택하세요.

  • Analysis Services 가져오기 마법사를 사용하여 기존 데이터 마이닝 솔루션에서 메타데이터를 가져올 수도 있습니다. 그러나 가져올 개별 개체를 선택할 수는 없습니다. 큐브, 데이터 원본 뷰 등을 포함하여 전체 데이터베이스를 가져옵니다. 또한 가져오기를 통해 만들어진 새 솔루션은 로컬 기본 데이터베이스를 사용하도록 자동으로 구성됩니다. 개체를 처리하거나 찾아보기 전에 이를 다른 인스턴스로 변경해야 할 수 있으며, 이전 버전의 Analysis Services에서 가져오는 경우 공급자에 대한 참조를 업데이트해야 할 수 있습니다.

다음으로 마이닝 구조와 연결된 데이터 마이닝 모델 하나를 만듭니다. 마이닝 구조만 만들고 나중에 모델을 추가할 수도 있지만 일반적으로 먼저 테스트 모델을 만드는 것이 가장 쉽습니다.

관계형 및 OLAP 마이닝 모델

다음으로 중요한 옵션은 관계형 데이터 원본을 사용할지 아니면 OLAP(다차원) 데이터를 기반으로 모델을 기반으로 하는지 여부입니다.

데이터 마이닝 마법사는 데이터 원본이 관계형인지 큐브에 있는지에 따라 이 시점에서 두 경로로 분기됩니다. 데이터 선택 프로세스를 제외한 다른 모든 것은 동일한 알고리즘 선택, 홀드아웃 데이터 집합을 추가하는 기능 등이지만 큐브 데이터를 선택하는 것은 관계형 데이터를 사용하는 것보다 조금 더 복잡합니다. 큐브를 기반으로 모델을 만드는 경우 마지막에 몇 가지 추가 옵션도 제공됩니다.

각 옵션에 대한 자세한 설명은 다음 주제를 참조하세요.

관계형 마이닝 구조 만들기
관계형 데이터 마이닝 모델을 빌드할 때 내리는 결정을 안내합니다.

OLAP 마이닝 구조 만들기
OLAP 큐브에서 데이터를 선택할 때 사용할 추가 옵션 및 선택 사항에 대해 설명합니다.

비고

데이터 마이닝을 수행하려면 큐브 또는 OLAP 데이터베이스가 필요하지 않습니다. 데이터가 큐브에 이미 저장되어 있거나 OLAP 차원 또는 OLAP 집계 또는 계산 결과를 마이닝하려는 경우가 아니면 데이터 마이닝에 관계형 테이블 또는 데이터 원본을 사용하는 것이 좋습니다.

알고리즘 선택

다음으로, 데이터 처리에 사용할 알고리즘을 결정해야 합니다. 이 결정은 내리기 어려울 수 있습니다. Analysis Services에서 제공되는 각 알고리즘은 서로 다른 기능을 가지며 서로 다른 결과를 생성하므로 데이터 및 비즈니스 문제에 가장 적합한 모델을 결정하기 전에 여러 가지 모델을 실험하고 시도할 수 있습니다. 각 알고리즘이 가장 적합한 작업에 대한 설명은 다음 항목을 참조하세요.

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

다른 알고리즘을 사용하여 여러 모델을 만들거나 알고리즘에 대한 매개 변수를 변경하여 다른 모델을 만들 수 있습니다. 선택한 알고리즘에 고정되어 있지 않으며 동일한 데이터에 여러 다른 모델을 만드는 것이 좋습니다.

모델링에 사용되는 데이터 정의

원본에서 데이터를 선택하는 것 외에도 사례 데이터가 포함된 데이터 원본 뷰의 테이블을 지정해야 합니다. 사례 테이블은 데이터 마이닝 모델을 학습하는 데 사용되므로 분석하려는 엔터티(예: 고객 및 해당 인구 통계 정보)를 포함해야 합니다. 각 사례는 고유해야 하며 사례 로 식별할 수 있어야 합니다.

사례 테이블을 지정하는 것 외에도 데이터에 중첩 테이블을 포함할 수 있습니다. 중첩 테이블에는 일반적으로 고객이 수행한 트랜잭션 또는 엔터티와 다대일 관계가 있는 특성과 같이 사례 테이블의 엔터티에 대한 추가 정보가 포함됩니다. 예를 들어 고객 사례 테이블에 조인된 중첩 테이블에는 각 고객이 구매한 제품 목록이 포함될 수 있습니다. 웹 사이트로의 트래픽을 분석하는 모델에서 중첩된 테이블에는 사용자가 방문한 페이지 시퀀스가 포함될 수 있습니다. 자세한 내용은 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.

추가 기능

올바른 데이터를 선택하고 데이터 원본을 올바르게 구성하는 데 도움이 되도록 데이터 마이닝 마법사는 다음과 같은 추가 기능을 제공합니다.

  • 데이터 형식의 자동 -detection: 마법사는 열 값의 고유성 및 분포를 검사한 다음 최상의 데이터 형식을 권장하고 데이터에 대한 사용 유형을 제안합니다. 목록에서 값을 선택하여 이러한 제안을 재정의할 수 있습니다.

  • 변수에 대한 제안: 대화 상자를 클릭하고 모델에 포함된 열의 상관 관계를 계산하는 분석기를 시작하고, 지금까지 모델의 구성을 고려할 때 열이 결과 특성의 예측 변수인지 여부를 결정할 수 있습니다. 다른 값을 입력하여 이러한 제안을 재정의할 수 있습니다.

  • 기능 선택: 대부분의 알고리즘은 적절한 예측 변수인 열을 자동으로 검색하고 이를 우선적으로 사용합니다. 값이 너무 많은 열에서 기능 선택이 적용되어 데이터의 카디널리티를 줄이고 의미 있는 패턴을 찾을 가능성을 높입니다. 모델 매개 변수를 사용하여 기능 선택 동작에 영향을 줄 수 있습니다.

  • 자동 큐브 조각화: 마이닝 모델이 OLAP 데이터 원본을 기반으로 하는 경우 큐브 특성을 사용하여 모델을 분할하는 기능이 자동으로 제공됩니다. 큐브 데이터의 하위 집합을 기반으로 모델을 크롤링하는 데 편리합니다.

마법사 설정 완료

마법사의 마지막 단계는 마이닝 구조 및 관련 마이닝 모델의 이름을 지정하는 것입니다. 만든 모델 유형에 따라 다음과 같은 중요한 옵션도 있을 수 있습니다.

  • 드릴스루 허용을 선택하면 모델에서 드릴스루 기능이 활성화됩니다. 드릴스루를 사용하면 적절한 권한이 있는 사용자는 모델을 빌드하는 데 사용되는 원본 데이터를 탐색할 수 있습니다.

  • OLAP 모델을 빌드하는 경우 옵션을 선택하거나, 새 데이터 마이닝 큐브를 만들거나, 데이터 마이닝 차원을 만들 수 있습니다. 이 두 옵션을 사용하면 완성된 모델을 더 쉽게 탐색하고 기본 데이터를 깊이 있게 분석할 수 있습니다.

데이터 마이닝 마법사를 완료한 후 데이터 마이닝 디자이너를 사용하여 마이닝 구조와 모델을 수정하거나, 모델의 정확도를 보거나, 구조 및 모델의 특성을 보거나, 모델을 사용하여 예측을 수행합니다.

맨 위로 돌아가기

데이터 마이닝 모델을 만들 때 내려야 하는 결정에 대해 자세히 알아보려면 다음 링크를 참조하세요.

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

콘텐츠 형식(데이터 마이닝)

데이터 형식(데이터 마이닝)

기능 선택(데이터 마이닝)

누락된 값(Analysis Services - 데이터 마이닝)

마이닝 모델에서의 드릴 스루

또한 참조하십시오

데이터 마이닝 도구
데이터 마이닝 솔루션