ドキュメント モデル ウィザードでは、作成したマイニング モデルに関する有用な情報を提供するレポートが作成されます。 作成したモデルを文書化することで、モデルの生成に使用されるデータのソースを追跡したり、モデルがいつ処理されたかに関する追加情報を取得したり、モデルの結果に影響を与えるパラメーターの変更を追跡したりできます。
ドキュメント モデル ウィザードの使用
[ データ マイニング ] タブをクリックします。
[ モデルの使用状況] グループで、[ ドキュメント モデル] をクリックします。
[ モデルの選択 ] ダイアログ ボックスで、レポートするモデルを選択し、[ 次へ] をクリックします。 ドキュメント モデル ウィザードは、ドキュメント化するモデルごとに個別に実行する必要があります。
[ドキュメントの詳細の選択] ダイアログ ボックスで、[情報の入力] または [概要情報] の 2 つのオプションのいずれかを選択します。
[完了] をクリックします。
ウィザードは、指定されたレポートを含む新しいワークシートを自動的に作成します。" モデル ドキュメント"、
レポートについて
データ マイニング モデルを文書化するレポートを作成する場合は、概要を作成できます。この概要には、モデルの名前と説明を含む基本情報、または基になる構造に関する詳細とマイニング モデルに関する高度な情報を含む完全なレポートが含まれます。
モデルの作成に使用されたアルゴリズムに応じて、さまざまな種類の情報が提供されます。 たとえば、関連付けモデルでは、生成されたアイテムセットとルールの数を把握することに関心があります。 クラスタリング モデルの場合、クラスターの数の方が興味深くなります。
次の表に、オプションと、各オプションのレポートで提供される情報を示します。
注
レポート内の列は、既定で特定のサイズに設定されます。 そのため、列名または値が非常に長い場合は、表示されないか、Excel で ### として表示される可能性があります。 値を表示するには、行のサイズを変更します。 セルが選択されている場合は、数式バーの右端にある二重矢印をクリックしてドラッグすると、完全な値または文字列が表示されます。
概要レポート
| メタデータ | モデル名 モデルの説明 アルゴリズム名 最後に処理された日付 |
|
| モデルの結果 | 関連付け | アイテムセットの数 ルールの数 |
| クラスタリング | クラスターの数 各クラスターのサポート |
|
| デシジョン ツリー | ツリーの数 各ツリー内のノードの数 |
|
| Linear regression (線形回帰) | ツリーの数 (常に 1) ノードの数 (常に 1) |
|
| Naïve Bayes | 重要な属性 | |
| ニューラルネットワーク | 入力ノードの数 出力ノードの数 非表示ノードの数 |
|
| シーケンス クラスタリング | クラスターの数 |
レポートの完成
完全なレポートには、概要レポートに含まれるすべてのものに加えて、モデルで使用されるデータの列と分析の結果に関する詳細情報が含まれています。
| メタデータ | モデル メタデータ | アルゴリズムのパラメーターと値 |
| 列メタデータ | 列名 使用方法 データの種類 コンテンツの種類 値 (不連続値のリスト、または値の範囲) |
|
| モデル統計 | 連続するカラム | 平均値 最小値 最大値 二乗平均平方根誤差 平均絶対誤差 ロジットスコア 回帰式 (線形回帰モデルの場合のみ) |
| 不連続列 | 合格の数 失敗数 ログ スコア 持ち上げる |
注
SQL Server Analysis Services でサポートされている任意のモデルの種類を文書化できます。 そのため、テーブル分析ツールを使用するか、データ マイニング クライアントのウィザードを使用して作成できない一部のモデルの種類がテーブルに一覧表示されます。 ただし、 高度なデータ マイニング クエリ エディターを使用して、すべてのモデルの種類を作成できます。 詳細については、「 クエリ (SQL Server データ マイニング アドイン)」を参照してください。