다음을 통해 공유


강의 4: 자전거 구매자 마이닝 모델 탐색

이 단원에서는 SELECT(DMX) 문을 사용하여 2단원: 예측 마이닝 구조에 마이닝 모델 추가에서 만든 의사 결정 트리 및 클러스터링 마이닝 모델의 콘텐츠를 탐색합니다.

마이닝 모델에 포함된 열은 마이닝 구조에 정의된 열이 아니라 알고리즘에서 찾은 추세 및 패턴을 설명하는 특정 열 집합입니다. 이러한 마이닝 모델 열은 DMSCHEMA_MINING_MODEL_CONTENT 행 집합 스키마 행 집합에 설명되어 있습니다. 예를 들어 콘텐츠 스키마 행 집합의 MODEL_NAME 열에는 마이닝 모델의 이름이 포함됩니다. 클러스터링 마이닝 모델의 경우 NODE_CAPTION 열에는 각 클러스터의 이름이 포함되고 NODE_DESCRIPTION 열에는 각 클러스터의 특성에 대한 설명이 포함됩니다. SELECT FROM <모델>.CONTENT 문을 DMX에서 사용하여 이러한 열을 찾아볼 수 있습니다. 이 문을 사용하여 마이닝 모델을 만드는 데 사용된 데이터를 탐색할 수도 있습니다. 이 문장을 사용하려면 마이닝 구조에서 드릴-스루를 사용하도록 설정해야 합니다. 문에 대한 자세한 내용은 SELECT FROM <모델을> 참조하세요. CASES(DMX).

SELECT DISTINCT 문을 사용하여 불연속 열의 모든 상태를 반환할 수도 있습니다. 예를 들어 성별 열에서 이 작업을 수행하면 쿼리가 반환 male 되고 female.

학습 과제

이 단원에서는 다음 작업을 수행합니다.

  • 마이닝 모델에 포함된 콘텐츠 탐색

  • 마이닝 모델을 학습하는 데 사용된 원본 데이터에서 사례를 반환합니다.

  • 특정 불연속 열에 사용할 수 있는 다양한 상태 살펴보기

마이닝 모델의 콘텐츠 반환

이 수업에서는 SELECT FROM <model>.CONTENT (DMX) 문을 사용하여 클러스터링 모델의 내용을 반환합니다.

다음은 SELECT FROM <모델>.CONTENT 문에 대한 일반적인 예입니다.

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

코드의 첫 번째 줄은 마이닝 모델 콘텐츠에서 반환할 열과 연결된 마이닝 모델을 정의합니다.

SELECT <select list> FROM [<mining model].CONTENT  

마이닝 모델 이름 옆에 있는 .CONTENT 절은 마이닝 모델에서 콘텐츠를 반환하도록 지정합니다. 마이닝 모델에 포함된 열에 대한 자세한 내용은 DMSCHEMA_MINING_MODEL_CONTENT 행 집합을 참조하세요.

필요에 따라 코드의 마지막 줄을 사용하여 문에서 반환된 결과를 필터링할 수 있습니다.

WHERE <where clause>  

예를 들어 쿼리 결과를 많은 수의 사례가 포함된 클러스터로만 제한하려는 경우 SELECT 문에 다음 WHERE 절을 추가할 수 있습니다.

WHERE NODE_SUPPORT > 100  

WHERE 문을 사용하는 방법에 대한 자세한 내용은 SELECT(DMX)를 참조하세요.

클러스터링 마이닝 모델의 콘텐츠를 반환하려면

  1. 개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.

    쿼리 편집기가 열리고 비어 있는 새 쿼리가 포함됩니다.

  2. SELECT FROM <모델의> 제네릭 예제를 복사합니다. 빈 쿼리에 대한 CONTENT 문입니다.

  3. 다음을 대체하십시오

    <select list>   
    

    와 함께

    *  
    

    *를 DMSCHEMA_MINING_MODEL_CONTENT 행 집합에 포함된 열 목록으로 바꿀 수도 있습니다.

  4. 다음을 대체하십시오

    [<mining model>]   
    

    와 함께

    [Clustering]  
    

    이제 전체 문은 다음과 같습니다.

    SELECT * FROM [Clustering].CONTENT  
    
  5. 파일 메뉴에서 DMXQuery1.dmx 다른 이름으로 저장을 클릭합니다.

  6. 다른 이름으로 저장 대화 상자에서 적절한 폴더로 이동하고 파일 SELECT_CONTENT.dmx이름을 지정합니다.

  7. 도구 모음에서 실행 단추를 클릭합니다.

    쿼리는 마이닝 모델의 콘텐츠를 반환합니다.

드릴스루를 사용하세요

다음 단계는 드릴스루 구문을 사용하여 의사 결정 트리 마이닝 모델 학습에 사용된 사례의 샘플링을 반환하는 것입니다. 이 단원에서는 SELECT FROM <모델을> 사용합니다. 의사 결정 트리 모델의 내용을 반환하는 CASES(DMX) 문입니다.

다음은 SELECT FROM <모델의> 일반적인 예입니다. CASES 문:

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

코드의 첫 번째 줄은 원본 데이터에서 반환할 열과 해당 열이 포함된 마이닝 모델을 정의합니다.

SELECT <select list> FROM [<mining model>].CASES  

CASES 절은 드릴스루 쿼리를 수행하고 있음을 지정합니다. 드릴스루를 사용하려면 마이닝 모델을 만들 때 드릴스루를 사용하도록 설정해야 합니다.

코드의 마지막 줄은 선택 사항이며 다음에서 사례를 요청하는 마이닝 모델의 노드를 지정합니다.

WHERE IsInNode('<node id>')  

IsInNode에서 WHERE 문을 사용하는 방법에 대한 자세한 내용은 SELECT FROM <모델을> 참조하세요. CASES(DMX).

마이닝 모델을 학습하는 데 사용된 사례를 반환하려면

  1. 개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.

    쿼리 편집기가 열리고 비어 있는 새 쿼리가 포함됩니다.

  2. SELECT FROM <모델의> 제네릭 예제를 복사합니다. 빈 쿼리에 대한 CASES 문입니다.

  3. 다음을 대체하십시오

    <select list>   
    

    와 함께

    *  
    

    *를 원본 데이터(예: [Bike Buyer])에 포함된 열 목록으로 바꿀 수도 있습니다.

  4. 다음을 대체하십시오

    [<mining model>]   
    

    와 함께

    [Decision Tree]  
    

    이제 전체 문은 다음과 같습니다.

    SELECT *   
    FROM [Decision Tree].CASES  
    
  5. 파일 메뉴에서 DMXQuery1.dmx 다른 이름으로 저장을 클릭합니다.

  6. 다른 이름으로 저장 대화 상자에서 적절한 폴더로 이동하고 파일 SELECT_DRILLTHROUGH.dmx이름을 지정합니다.

  7. 도구 모음에서 실행 단추를 클릭합니다.

    이 쿼리는 의사 결정 트리 마이닝 모델을 학습시키는 데 사용된 원본 데이터를 반환합니다.

불연속 마이닝 모델 열의 상태를 반환합니다.

다음 단계는 SELECT DISTINCT 문을 사용하여 지정된 마이닝 모델 열에서 가능한 여러 상태를 반환하는 것입니다.

다음은 "SELECT DISTINCT" 문의 일반적인 예입니다.

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

코드의 첫 번째 줄은 상태가 반환되는 마이닝 모델 열을 정의합니다.

SELECT DISTINCT [<column>]   

열의 모든 상태를 반환하려면 DISTINCT를 포함해야 합니다. DISTINCT를 제외하면 전체 문은 예측을 위한 간편 방법이 되어 지정된 열의 가장 가능성 있는 상태를 반환합니다. 자세한 내용은 SELECT(DMX)를 참조하세요.

불연속 열의 상태를 반환하려면

  1. 개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.

    쿼리 편집기가 열리고 비어 있는 새 쿼리가 포함됩니다.

  2. SELECT Distinct 문의 제네릭 예제를 빈 쿼리에 복사합니다.

  3. 다음을 대체하십시오

    [<column,name>   
    

    와 함께

    [Bike Buyer]  
    
  4. 다음을 대체하십시오

    [<mining model>]   
    

    와 함께

    [Decision Tree]  
    

    이제 전체 문은 다음과 같습니다.

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  5. 파일 메뉴에서 DMXQuery1.dmx 다른 이름으로 저장을 클릭합니다.

  6. 다른 이름으로 저장 대화 상자에서 적절한 폴더로 이동하고 파일 SELECT_DISCRETE.dmx이름을 지정합니다.

  7. 도구 모음에서 실행 단추를 클릭합니다.

    이 쿼리는 Bike Buyer 열의 가능한 상태를 반환합니다.

다음 단원에서는 의사 결정 트리 마이닝 모델을 사용하여 잠재 고객이 자전거 구매자가 될지 여부를 예측합니다.

다음 단원:

5단원: 예측 쿼리 실행