次の方法で共有


ニューラル ネットワーク モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)

このトピックでは、Microsoft ニューラル ネットワーク アルゴリズムを使用するモデルに固有のマイニング モデル コンテンツについて説明します。 すべてのモデルの種類で共有される統計と構造、およびマイニング モデル コンテンツに関連する用語の一般的な定義を解釈する方法については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

ニューラル ネットワーク モデルの構造について

各ニューラル ネットワーク モデルには、モデルとそのメタデータを表す単一の親ノードと、入力属性に関する説明的な統計情報を提供する限界統計ノード (NODE_TYPE = 24) があります。 マージナル統計ノードは、個々のノードのデータを照会する必要がないように、入力に関する情報を要約するため便利です。

これら 2 つのノードの下には、少なくとも 2 つのノードがあり、モデルに含まれる予測可能な属性の数によっては、さらに多くのノードが存在する可能性があります。

  • 最初のノード (NODE_TYPE = 18) は、常に入力レイヤーの最上位ノードを表します。 この最上位ノードの下には、実際の入力属性とその値を含む入力ノード (NODE_TYPE = 21) があります。

  • 連続するノードにはそれぞれ異なる サブネットワーク が含まれています (NODE_TYPE = 17)。 各サブネットワークには、常に非表示レイヤー (NODE_TYPE = 19) と、そのサブネットワークの出力レイヤー (NODE_TYPE = 20) が含まれます。

ニューラルネットワークのモデルコンテンツの構造

入力レイヤーの情報は簡単です。各入力レイヤーの最上位ノード (NODE_TYPE = 18) は、入力ノードのコレクションのオーガナイザーとして機能します (NODE_TYPE = 21)。 入力ノードの内容を次の表に示します。

各サブネットワーク (NODE_TYPE = 17) は、特定の予測可能な属性に対する入力レイヤーの影響の分析を表します。 予測可能な出力が複数ある場合は、複数のサブネットワークがあります。 各サブネットワークの非表示レイヤーには、複数の非表示ノード (NODE_TYPE = 22) が含まれています。このノードには、その特定の非表示ノードで終了する各遷移の重みの詳細が含まれています。

出力レイヤー (NODE_TYPE = 20) には、それぞれ予測可能な属性の個別の値を含む出力ノード (NODE_TYPE = 23) が含まれています。 予測可能な属性が連続する数値データ型の場合、その属性の出力ノードは 1 つだけです。

ロジスティック回帰アルゴリズムでは、予測可能な結果が 1 つだけで、潜在的に多くの入力を持つニューラル ネットワークの特殊なケースが使用されます。 ロジスティック回帰では、非表示レイヤーは使用されません。

入力とサブネットワークの構造を調べる最も簡単な方法は、 Microsoft 汎用コンテンツ ツリー ビューアーを使用することです。 任意のノードをクリックして展開し、子ノードを表示したり、ノードに含まれる重みと他の統計情報を表示したりできます。

データを操作し、モデルが入力と出力をどのように関連付けるかを確認するには、 Microsoft ニューラル ネットワーク ビューアーを使用します。 このカスタム ビューアーを使用すると、入力属性とその値をフィルター処理し、それらが出力にどのように影響するかをグラフィカルに確認できます。 ビューアーのツールヒントには、入力値と出力値の各ペアに関連付けられている確率とリフトが表示されます。 詳細については、「 Microsoft ニューラル ネットワーク ビューアーを使用したモデルの参照」を参照してください。

ニューラル ネットワーク モデルのモデル コンテンツ

このセクションでは、ニューラル ネットワークに特定の関連性を持つマイニング モデル コンテンツ内の列についてのみ、詳細と例を示します。 ここでは説明されていないスキーマ行セットの汎用列 (MODEL_CATALOGやMODEL_NAMEなど) の詳細、またはマイニング モデルの用語の説明については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

モデルカタログ
モデルが格納されているデータベースの名前。

MODEL_NAME
モデルの名前。

属性名
このノードに対応する属性の名前。

ノード コンテンツ
モデルルート 空白
マージナル統計 空白
入力レイヤー 空白
入力ノード 入力属性名
隠れ層 空白
非表示ノード 空白
出力レイヤー 空白
出力ノード 出力属性名

ノード名
ノード名。 この列には、NODE_UNIQUE_NAMEと同じ値が含まれています。

NODE_UNIQUE_NAME
ノードの一意の名前。

名前と ID がモデルに関する構造情報を提供する方法の詳細については、「 ノード名と ID の使用」セクションを参照してください。

NODE_TYPE
ニューラル ネットワーク モデルでは、次の種類のノードが出力されます。

ノードの種類 ID 説明
1 モデル。
十七 サブネットワークのオーガナイザー ノード。
18 入力レイヤーのオーガナイザー ノード。
19 非表示レイヤーのオーガナイザー ノード。
20 出力レイヤーのオーガナイザー ノード。
21 (二十一) 入力属性ノード。
22 非表示レイヤー ノード
23 出力属性ノード。
二十四 マージナル統計ノード。

ノードキャプション
ノードに関連付けられているラベルまたはキャプション。 ニューラル ネットワーク モデルでは、常に空白です。

子供の基数
ノードに含まれる子の数の見積もり。

ノード コンテンツ
モデル ルート 少なくとも 1 つのネットワーク、1 つの必要な限界ノード、1 つの必須入力レイヤーを含む子ノードの数を示します。 たとえば、値が 5 の場合、3 つのサブネットワークがあります。
周辺統計 常に 0。
入力レイヤー モデルで使用された入力属性値のペアの数を示します。
入力ノード 常に 0。
隠れ層 モデルによって作成された非表示ノードの数を示します。
非表示ノード 常に 0。
出力レイヤー 出力値の数を示します。
出力ノード 常に 0。

親ユニーク名
ノードの親の一意の名前。 ルート レベルのすべてのノードに対して NULL が返されます。

名前と ID がモデルに関する構造情報を提供する方法の詳細については、「 ノード名と ID の使用」セクションを参照してください。

ノードの説明
ノードのわかりやすい説明。

ノード コンテンツ
モデルの根 空白
マージナル統計 空白
入力レイヤー 空白
入力ノード 入力属性名
隠れ層 空白
非表示ノード 非表示ノードのリスト内の非表示ノードのシーケンスを示す整数。
出力レイヤー 空白
出力ノード 出力属性が連続している場合は、出力属性の名前が含まれます。

出力属性が不連続または分離されている場合は、属性の名前と値が含まれます。

NODE_RULE
ノードに埋め込まれている規則の XML 記述。

ノード コンテンツ
モデルの基盤 空白
マージナル統計 空白
入力レイヤー 空白
入力ノード NODE_DESCRIPTION列と同じ情報を含む XML フラグメント。
隠れ層 空白
非表示ノード 非表示ノードのリスト内の非表示ノードのシーケンスを示す整数。
出力レイヤー 空白
出力ノード NODE_DESCRIPTION列と同じ情報を含む XML フラグメント。

限界規則
ニューラル ネットワーク モデルの場合は、常に空白です。

NODE_PROBABILITY
このノードに関連付けられている確率。 ニューラル ネットワーク モデルの場合は、常に 0 です。

周辺確率
親ノードからノードに到達する確率。 ニューラル ネットワーク モデルの場合は、常に 0 です。

ノード配分
ノードの統計情報を含む入れ子になったテーブル。 各ノード タイプのこのテーブルの内容の詳細については、「 NODE_DISTRIBUTION テーブルについて」セクションを参照してください。

NODE_SUPPORT
ニューラル ネットワーク モデルの場合は、常に 0 です。

このモデルの種類の出力は確率論的ではないため、サポート確率は常に 0 です。 重みだけがアルゴリズムにとって意味があります。したがって、アルゴリズムは確率、サポート、または分散を計算しません。

特定の値のトレーニング ケースでのサポートに関する情報を取得するには、限界統計ノードを参照してください。

MSOLAP_MODEL_COLUMN
|Node|コンテンツ|
|----------|-------------|
|モデル ルート|空白|
|限界統計|空白|
|入力レイヤー|空白|
|入力ノード|入力属性名.|
|隠しレイヤー|空白|
|非表示ノード|空白|
|出力レイヤー|空白|
|出力ノード|入力属性名.|

MSOLAP_NODE_SCORE
ニューラル ネットワーク モデルの場合は、常に 0 です。

MSOLAP_NODE_SHORT_CAPTION
ニューラル ネットワーク モデルの場合は、常に空白です。

注釈

ニューラル ネットワーク モデルをトレーニングする目的は、入力から中間点、および中間点からエンドポイントへの各遷移に関連付けられている重みを決定することです。 そのため、モデルの入力レイヤーは、モデルの構築に使用された実際の値を格納するために主に存在します。 非表示レイヤーには、計算された重みが格納され、入力属性へのポインターが返されます。 出力レイヤーには予測可能な値が格納され、非表示レイヤーの中間点へのポインターも返されます。

ノード名と ID の使用

ニューラル ネットワーク モデルのノードの名前付けでは、非表示レイヤーを入力レイヤーに関連付け、出力レイヤーを非表示レイヤーに関連付けやすくするために、ノードの種類に関する追加情報が提供されます。 次の表は、各レイヤーのノードに割り当てられる ID の規則を示しています。

ノード タイプ ノード ID の規則
モデルルート (1) 00000000000000000.
マージナル統計ノード (24) 10000000000000000
入力レイヤー (18) 30000000000000000
入力ノード (21) 60000000000000000 から始まる
サブネットワーク (17) 20000000000000000
非表示レイヤー (19) 40000000000000000
非表示ノード (22) 7000000000000000 から開始します。
出力レイヤー (20) 50000000000000000
出力ノード (23) 8000000000000000 から開始

非表示ノード (NODE_TYPE = 22) のNODE_DISTRIBUTION テーブルを表示することで、特定の非表示レイヤー ノードに関連する入力属性を特定できます。 NODE_DISTRIBUTION テーブルの各行には、入力属性ノードの ID が含まれています。

同様に、出力ノードのNODE_DISTRIBUTION テーブルを表示することで、出力属性に関連する非表示レイヤーを特定できます (NODE_TYPE = 23)。 NODE_DISTRIBUTION テーブルの各行には、非表示レイヤー ノードの ID と関連する係数が含まれています。

NODE_DISTRIBUTION テーブル内の情報の解釈

一部のノードでは、NODE_DISTRIBUTION テーブルを空にすることができます。 ただし、入力ノード、非表示レイヤー ノード、出力ノードの場合、NODE_DISTRIBUTION テーブルにはモデルに関する重要で興味深い情報が格納されます。 この情報を解釈しやすくするために、NODE_DISTRIBUTION テーブルには、ATTRIBUTE_VALUE列の値が不連続 (4)、Discretized (5)、または Continuous (3) のどちらであるかを示す各行の VALUETYPE 列が含まれています。

入力ノード

入力レイヤーには、モデルで使用された属性の値ごとにノードが含まれています。

不連続属性: 入力ノードは、属性の名前とその値のみをATTRIBUTE_NAMEおよびATTRIBUTE_VALUE列に格納します。 たとえば、[Work Shift] が列の場合、AM や PM など、モデルで使用された列の値ごとに個別のノードが作成されます。 各ノードのNODE_DISTRIBUTION テーブルには、属性の現在の値のみが一覧表示されます。

分離された数値属性: 入力ノードには、属性の名前と値 (範囲または特定の値を指定できます) が格納されます。 すべての値は、[問題ごとの時間] の値として 、'77.4 - 87.4' や ' < 64.0' などの式で表されます。 各ノードのNODE_DISTRIBUTION テーブルには、属性の現在の値のみが一覧表示されます。

連続属性: 入力ノードには、属性の平均値が格納されます。 各ノードのNODE_DISTRIBUTION テーブルには、属性の現在の値のみが一覧表示されます。

非表示レイヤー ノード

非表示レイヤーには、可変数のノードが含まれています。 各ノードのNODE_DISTRIBUTION テーブルには、非表示レイヤーから入力レイヤー内のノードへのマッピングが含まれています。 ATTRIBUTE_NAME列には、入力レイヤー内のノードに対応するノード ID が含まれています。 ATTRIBUTE_VALUE列には、入力ノードと非表示レイヤー ノードの組み合わせに関連付けられた重みが含まれます。 テーブルの最後の行には、非表示レイヤー内の非表示ノードの重みを表す係数が含まれています。

出力ノード

出力レイヤーには、モデルで使用された出力値ごとに 1 つの出力ノードが含まれています。 各ノードのNODE_DISTRIBUTION テーブルには、出力レイヤーから非表示レイヤー内のノードへのマッピングが含まれています。 ATTRIBUTE_NAME列には、非表示レイヤー内のノードに対応するノード ID が含まれています。 ATTRIBUTE_VALUE列には、出力ノードと非表示レイヤー ノードの組み合わせに関連付けられている重みが含まれています。

NODE_DISTRIBUTION テーブルには、属性の型に応じて、次の追加情報があります。

不連続属性: NODE_DISTRIBUTION テーブルの最後の 2 行には、ノード全体の係数と、属性の現在の値が含まれます。

分離された数値属性: 属性の値が値の範囲であることを除き、不連続属性と同じです。

連続属性: NODE_DISTRIBUTION テーブルの最後の 2 行には、属性の平均、ノード全体の係数、および係数の分散が含まれます。

こちらもご覧ください

Microsoft ニューラル ネットワーク アルゴリズム
Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス
ニューラル ネットワーク モデルクエリの例