次の方法で共有


レッスン 4: 自転車購入者マイニングモデルの閲覧

このレッスンでは、 SELECT (DMX) ステートメントを使用して、「 レッスン 2: 予測マイニング構造へのマイニング モデルの追加」で作成したデシジョン ツリーとクラスタリング マイニング モデルのコンテンツを調べます。

マイニング モデルに含まれる列は、マイニング構造によって定義された列ではなく、アルゴリズムによって検出される傾向とパターンを記述する特定の列セットです。 これらのマイニング モデル列は、 DMSCHEMA_MINING_MODEL_CONTENT行セット スキーマ行セットで説明されています。 たとえば、コンテンツ スキーマ行セットの MODEL_NAME 列には、マイニング モデルの名前が含まれています。 クラスタリング マイニング モデルの場合、NODE_CAPTION列には各クラスターの名前が含まれており、NODE_DESCRIPTION列には各クラスターの特性の説明が含まれています。 SELECT FROM <model>を使用して、これらの列を参照できます。DMX の CONTENT ステートメント。 このステートメントを使用して、マイニング モデルの作成に使用されたデータを調べることもできます。 このステートメントを使用するには、マイニング構造でドリルスルーを有効にする必要があります。 ステートメントの詳細については、SELECT FROM <model>.CASES (DMX) を参照してください。

SELECT DISTINCT ステートメントを使用して、不連続列のすべての状態を返すこともできます。 たとえば、性別列に対してこの操作を実行すると、クエリは malefemaleを返します。

このレッスンの作業

このレッスンでは、次のタスクを実行します。

  • マイニング モデルに含まれるコンテンツを調べる

  • マイニング モデルのトレーニングに使用されたソース データからケースを返す

  • 特定の不連続列で使用できるさまざまな状態を調べる

マイニング モデルのコンテンツを返す

このレッスンでは、 SELECT FROM <model>を使用します。 クラスタリング モデルの内容を返す CONTENT (DMX) ステートメント。

SELECT FROM <model>の一般的な例を次に示します。CONTENT ステートメント:

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

コードの最初の行では、マイニング モデルコンテンツから返す列と、それらが関連付けられているマイニング モデルを定義します。

SELECT <select list> FROM [<mining model].CONTENT  

ザ。マイニング モデルの名前の横にある CONTENT 句は、マイニング モデルからコンテンツを返すように指定します。 マイニング モデルに含まれる列の詳細については、「 DMSCHEMA_MINING_MODEL_CONTENT行セット」を参照してください。

必要に応じて、コードの最後の行を使用して、ステートメントによって返される結果をフィルター処理できます。

WHERE <where clause>  

たとえば、クエリの結果を多数のケースを含むクラスターのみに制限する場合は、SELECT ステートメントに次の WHERE 句を追加できます。

WHERE NODE_SUPPORT > 100  

WHERE ステートメントの使用方法の詳細については、 SELECT (DMX) を参照してください。

クラスタリング マイニング モデルの内容を返すには

  1. オブジェクト エクスプローラーで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが含まれています。

  2. SELECT FROM <model>の一般的な例をコピーします。CONTENT ステートメントを空のクエリに挿入します。

  3. 次のコードを置き換えます。

    <select list>   
    

    次の内容に置き換えます。

    *  
    

    * は、 DMSCHEMA_MINING_MODEL_CONTENT行セットに含まれる列の一覧に置き換えることもできます。

  4. 次のコードを置き換えます。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Clustering]  
    

    これで、完全なステートメントは次のようになります。

    SELECT * FROM [Clustering].CONTENT  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに SELECT_CONTENT.dmx名前を付けます。

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    このクエリは、マイニング モデルのコンテンツを返します。

ドリルスルーを使用する

次の手順では、ドリルスルー ステートメントを使用して、デシジョン ツリー マイニング モデルのトレーニングに使用されたケースのサンプリングを返します。 このレッスンでは、 SELECT FROM <model>を使用します。 デシジョン ツリー モデルの内容を返す CASES (DMX) ステートメント。

SELECT FROM <model>のCASES ステートメントの一般的な例を以下に示します。

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

コードの最初の行では、ソース データから返す列と、それらが含まれるマイニング モデルを定義します。

SELECT <select list> FROM [<mining model>].CASES  

.CASES 句は、ドリルスルー クエリを実行することを指します。 ドリルスルーを使用するには、マイニング モデルの作成時にドリルスルーを有効にする必要があります。

コードの最後の行は省略可能であり、ケースを要求するマイニング モデル内のノードを指定します。

WHERE IsInNode('<node id>')  

IsInNode で WHERE ステートメントを使用する方法の詳細については、SELECT <model>から (DMX) CASES を参照してください。

マイニングモデルのトレーニングに使用されたケースを戻すには

  1. オブジェクト エクスプローラーで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが含まれています。

  2. SELECT FROM <model>の一般的な例をコピーします。空のクエリに対する CASES ステートメント。

  3. 次のコードを置き換えます。

    <select list>   
    

    次の内容に置き換えます。

    *  
    

    * は、ソース データに含まれる列の一覧 ([Bike Buyer] など) に置き換えることもできます。

  4. 次のコードを置き換えます。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Decision Tree]  
    

    これで、完全なステートメントは次のようになります。

    SELECT *   
    FROM [Decision Tree].CASES  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに SELECT_DRILLTHROUGH.dmx名前を付けます。

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    このクエリは、デシジョン ツリー マイニング モデルのトレーニングに使用されたソース データを返します。

不連続マイニング モデル列の状態を返す

次の手順では、SELECT DISTINCT ステートメントを使用して、指定されたマイニング モデル列のさまざまな可能な状態を返します。

SELECT DISTINCT ステートメントの一般的な例を次に示します。

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

コードの最初の行は、状態が返されるマイニング モデル列を定義します。

SELECT DISTINCT [<column>]   

列のすべての状態を返すには、DISTINCT を含める必要があります。 DISTINCT を除外すると、完全なステートメントが予測のショートカットになり、指定された列の最も可能性の高い状態が返されます。 詳細については、「SELECT (DMX)」を参照してください。

不連続列の状態を取得するには

  1. オブジェクト エクスプローラーで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが含まれています。

  2. SELECT Distinct ステートメントの一般的な例を空白のクエリにコピーします。

  3. 次のコードを置き換えます。

    [<column,name>   
    

    次の内容に置き換えます。

    [Bike Buyer]  
    
  4. 次のコードを置き換えます。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Decision Tree]  
    

    これで、完全なステートメントは次のようになります。

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに SELECT_DISCRETE.dmx名前を付けます。

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    このクエリは、Bike Buyer 列の使用可能な状態を返します。

次のレッスンでは、デシジョン ツリー マイニング モデルを使用して、潜在顧客が自転車購入者になるかどうかを予測します。

次のレッスン

レッスン 5: 予測クエリの実行