時系列モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)

すべてのマイニングモデルは、同じ構造を使用してコンテンツを格納します。この構造は、データマイニングコンテンツスキーマ行セットに従って定義されます。ただし、その標準構造内では、情報を含むノードは、さまざまな種類のツリーを表すためにさまざまな方法で配置されます。このトピックでは、Microsoft Time Series アルゴリズムに基づくマイニングモデルのノードの編成方法と各ノードの意味について説明します。

すべてのモデルの種類に適用される一般的なマイニングモデルコンテンツの説明については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

このトピックを確認するときは、時系列モデルの内容を参照すると便利な場合があります。基本的なデータマイニングチュートリアルを完了することで、時系列モデルを作成できます。チュートリアルで作成するモデルは、ARIMA アルゴリズムと ARTXP アルゴリズムの両方を使用してデータをトレーニングする混合モデルです。詳細については、「予測構造とモデルの作成 (中間データマイニングチュートリアル)」を参照してください。マイニングモデルの内容を表示する方法については、「データマイニングモデルビューアー」を参照してください。

時系列モデルの構造について

時系列モデルには、モデルとそのメタデータを表す単一の親ノードがあります。その親ノードの下には、モデルの作成に使用したアルゴリズムに応じて、1 つまたは 2 つの時系列ツリーがあります。

混合モデルを作成すると、ARIMA 用と ARTXP 用の 2 つのツリーがモデルに追加されます。 ARTXP アルゴリズムのみを使用するか、ARIMA アルゴリズムのみを使用することを選択した場合、そのアルゴリズムに対応する単一のツリーが作成されます。 FORECAST_METHOD パラメーターを設定して、使用するアルゴリズムを指定します。 ARTXP、ARIMA、または混合モデルのどちらを使用するかの詳細については、「 Microsoft Time Series Algorithm」を参照してください。

次の図は、既定の設定で作成され、混合モデルを作成した時系列データマイニングモデルの例を示しています。 2 つのモデルの違いをより簡単に比較できるように、ここでは ARTXP モデルが図の左側に表示され、ARIMA モデルが図の右側に表示されます。 ARTXP は、小さい分岐と小さい分岐に分割されるツリーのような構造ですが、ARIMA アルゴリズムによって作成される構造は、小さなコンポーネントから上に構築されたピラミッドに似ています。

時系列モデルのコンテンツの構造

覚えておくべき重要なポイントは、情報が ARIMA ツリーと ARTXP ツリー内にまったく異なる方法で配置されていることです。また、2 つのツリーはルートノードでのみ関連していると見なす必要があります。 2 つの表現は便宜上 1 つのモデルで表示されますが、2 つの独立したモデルとして扱う必要があります。 ARTXP は実際のツリー構造を表しますが、ARIMA は表しません。

Microsoft 汎用モデルコンテンツツリービューアーを使用して ARIMA と ARTXP の両方を使用するモデルを表示すると、ARTXP モデルと ARIMA モデルのノードはすべて親時系列モデルの子ノードとして表示されます。ただし、ノードに適用されるラベルによって簡単に区別できます。

ノードの最初のセットにはラベル (すべて) が付き、ARTXP アルゴリズムによる分析の結果を表します。
2 番目のノードセットには ARIMA というラベルが付き、ARIMA アルゴリズムによる分析結果が表されます。

警告

ARTXP ツリーの名前 (すべて) は、下位互換性のためにのみ保持されます。 SQL Server 2008 より前のバージョンでは、タイムシリーズアルゴリズムでは、分析に単一のアルゴリズムである ARTXP アルゴリズムが使用されていました。

次のセクションでは、これらの各モデルの種類内でノードがどのように配置されるかについて説明します。

ARTXP モデルの構造

ARTXP アルゴリズムは、デシジョンツリーモデルに似たモデルを作成します。予測可能な属性をグループ化し、大きな違いが見つかるたびに分割します。そのため、各 ARTXP モデルには、予測可能な属性ごとに個別の分岐が含まれています。たとえば、基本的なデータマイニングチュートリアルでは、複数のリージョンの売上を予測するモデルを作成します。この場合、[ Amount] は予測可能な属性であり、リージョンごとに個別の分岐が作成されます。予測可能な属性 が [Amount] と [Quantity] の 2 つある場合は、属性とリージョンの組み合わせごとに個別の分岐が作成されます。

ARTXP ブランチの最上位ノードには、デシジョンツリーのルートノードにあるのと同じ情報が含まれています。これには、そのノードの子の数 (CHILDREN_CARDINALITY)、このノードの条件を満たすケースの数 (NODE_SUPPORT)、さまざまな説明統計 (NODE_DISTRIBUTION) が含まれます。

ノードに子がない場合は、ケースをさらにサブグループに分割することを正当化する重要な条件が見つからなかったことを意味します。分岐はこの時点で終了し、ノードは リーフノードと呼ばれます。リーフノードには、ARTXP 数式の構成要素である属性、係数、および値が含まれています。

一部のブランチには、デシジョンツリーモデルと同様に、追加の分割が含まれる場合があります。たとえば、ヨーロッパ地域の売上を表す木の枝分かれは、2つの枝に分かれます。分割は、2 つのグループ間で大きな違いを引き起こす条件が見つかった場合に発生します。親ノードは、[Amount]などの分割の原因となった属性の名前と、親ノードに存在するケースの数を示します。リーフノードでは、属性の値 ([Sales] >10,000 と [Sales] < 10,000 など)、各条件をサポートするケースの数、および ARTXP 数式の詳細が提供されます。

注

数式を表示する場合は、リーフノードレベルで完全な回帰式を見つけることができますが、中間ノードまたはルートノードでは見つかりません。

ARIMA モデルの構造

ARIMA アルゴリズムは、データ系列 ( [Region] など) と予測可能な属性 ([ Sales Amount] など) の組み合わせごとに 1 つの情報を作成します。これは、時間の経過に伴う予測可能な属性の変化を表す式です。

各系列の数式は、データ内で検出された周期構造ごとに 1 つずつ、複数のコンポーネントから派生します。たとえば、月単位で収集される売上データがある場合、アルゴリズムは月単位、四半期単位、または年単位の定期的な構造を検出する可能性があります。

アルゴリズムは、検出された周期性ごとに、親ノードと子ノードの個別のセットを出力します。 1 つのタイムスライスの既定の周期性は 1 で、すべてのモデルに自動的に追加されます。 PERIODICITY_HINTパラメータに複数の値を入力することで、可能な周期構造を指定できます。ただし、アルゴリズムが定期的な構造を検出しない場合、そのヒントの結果は出力されません。

モデルコンテンツで出力される各定期的な構造には、次のコンポーネントノードが含まれています。

自動回帰順序 (AR) のノード
移動平均 (MA) のノード

これらの用語の意味については、「 Microsoft Time Series Algorithm」を参照してください。

差の順序は数式の重要な部分であり、式で表されます。差異順序の使用方法の詳細については、「 Microsoft Time Series Algorithm Technical Reference」を参照してください。

時系列モデルの内容

このセクションでは、時系列モデルに特定の関連性を持つマイニングモデルコンテンツ内の列についてのみ、詳細と例を示します。

スキーマ行セットの汎用列 (MODEL_CATALOGやMODEL_NAMEなど) の詳細、またはマイニングモデルの用語の説明については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

モデルカタログ
モデルが格納されているデータベースの名前。

MODEL_NAME
モデルの名前。

属性名
ノードで表されるデータ系列の予測可能な属性。 (MSOLAP_MODEL_COLUMNの場合と同じ値)。

ノード名
ノード名。

現在、この列には NODE_UNIQUE_NAME と同じ値が含まれていますが、これは将来のリリースで変更される可能性があります。

NODE_UNIQUE_NAME
ノードの一意の名前。モデルの親ノードの名前は常に TS です。

ARTXP: 各ノードは TS の後に 16 進数の数値で表されます。ノードの順序は重要ではありません。

たとえば、TS ツリーのすぐ下にある ARTXP ノードには、TS00000001-TS0000000b という番号が付けられます。

ARIMA: ARIMA ツリー内の各ノードは、TA とそれに続く 16 進数の数値で表されます。子ノードには、親ノードの一意の名前の後に、ノード内のシーケンスを示す別の 16 進数が含まれています。

ARIMA ツリーはすべてまったく同じ構造になっています。各ルートには、次の表に示すノードと名前付け規則が含まれています。

ARIMA ノード ID と種類	ノード名の例
ARIMA 根 (27)	TA0000000b
ARIMA 周期構造 (28)	TA0000000b00000000
ARIMA Auto Regressive (29)	TA0000000b00000000
ARIMA 移動平均 (30)	TA0000000b00000001

NODE_TYPE
時系列モデルでは、アルゴリズムに応じて次のノードの種類が出力されます。

ARTXP:

ノードの種類 ID	説明
1 (モデル)	時系列
3 (インテリア)	ARTXP 時系列ツリーの内部枝を示します。
16 (時系列ツリー)	予測可能な属性と系列に対応する ARTXP ツリーのルート。
15 (時系列)	ARTXP ツリーのリーフノード。

ARIMA:

ノードの種類 ID	説明
27 (ARIMA Root)	ARIMA ツリーの最上位ノード。
28 (ARIMA 周期構造)	1 つの周期構造を記述する ARIMA ツリーのコンポーネント。
29 (ARIMA Autoregressive)	1 つの周期構造の係数を格納します。
30 (ARIMA 移動平均)	1 つの周期構造の係数を格納します。

ノードキャプション
ノードに関連付けられているラベルまたはキャプション。

このプロパティは主に表示目的です。

ARTXP: 属性と値の範囲の組み合わせとして表示されるノードの分割条件が含まれます。

ARIMA: ARIMA 式の短い形式を含みます。

ARIMA 式の形式については、「ARIMA のマイニング凡例」を参照してください。

子供の基数
ノードに含まれる直接の子の数。

親ユニーク名
ノードの親の一意の名前。ルートレベルのすべてのノードに対して NULL が返されます。

ノードの説明
現在のノードのルール、分割、または数式のテキスト内の説明。

ARTXP: 詳細については、「 ARTXP ツリーについて」を参照してください。

ARIMA: 詳細については、「 ARIMA ツリーについて」を参照してください。

ノードルール
現在のノード内のルール、分割、または数式の XML 記述。

ARTXP: NODE_RULEは通常、NODE_CAPTIONに対応します。

ARIMA: 詳細については、「 ARIMA ツリーについて」を参照してください。

限界規則
そのノードに固有の分割またはコンテンツの XML 記述。

ARTXP: MARGINAL_RULEは通常、NODE_DESCRIPTIONに対応します。

ARIMA: 常に空白。代わりにNODE_RULEを使用してください。

ノード確率
ARTXP: ツリーノードの場合は、常に 1 です。リーフノードの場合、モデルルートノードからノードに到達する確率。

ARIMA: 常に 0。

周辺確率
ARTXP: ツリーノードの場合は、常に 1 です。リーフノードにおける、直近の親ノードからそのノードに到達する確率。

ARIMA: 常に 0。

ノード配分
ノードの確率ヒストグラムを含むテーブル。時系列モデルでは、この入れ子になったテーブルには、実際の回帰式を組み立てるために必要なすべてのコンポーネントが含まれています。

ARTXP ツリー内のノード分散テーブルの詳細については、「 ARTXP ツリーについて」を参照してください。

ARIMA ツリーのノード分布テーブルの詳細については、「 ARIMA ツリーについて」を参照してください。

読み取り可能な形式で構成されたすべての定数とその他のコンポーネントを表示する場合は、タイムシリーズビューアーを使用し、ノードをクリックして、[ マイニング凡例] を開きます。

ノードサポート
このノードをサポートするケースの数。

ARTXP:(All) ノードの場合、ブランチに含まれるタイムスライスの合計数を示します。

ターミナルノードの場合、NODE_CAPTIONによって記述される範囲に含まれるタイムスライスの数を示します。ターミナルノード内のタイムスライスの数は、常に分岐 (All) ノードのNODE_SUPPORT値に合計されます。

ARIMA: 現在の定期的な構造をサポートするケースの数。サポートの値は、現在の周期構造のすべてのノードで繰り返されます。

MSOLAP_MODEL_COLUMN
ノードで表されるデータ系列の予測可能な属性。 (ATTRIBUTE_NAMEの場合と同じ値)。

MSOLAP_NODE_SCORE
ツリーまたは分割の情報値を特徴付けする数値。

ARTXP: 分割のないノードの場合、値は常に 0.0 です。分割されたノードの場合、値は分割の興味深さのスコアを表します。

スコア付け方法の詳細については、「特徴選択 (データマイニング)」を参照してください。

ARIMA: ARIMA モデルのベイジアン情報抽出条件 (BIC) スコア。数式に関連するすべての ARIMA ノードで同じスコアが設定されます。

MSOLAP_ノード_短いキャプション
ARTXP: NODE_DESCRIPTIONと同じ情報。

ARIMA: NODE_CAPTIONと同じ情報、つまり ARIMA 式の短い形式。

ARTXP ツリーについて

ARTXP モデルは、線形であるデータの領域と、他の要因で分割されたデータの領域を明確に分離します。予測可能な属性の変更を独立変数の関数として直接表すことができる場合は、回帰式がそのリレーションシップを表すように計算されます。

たとえば、ほとんどのデータ系列で時間と売上の間に直接的な相関関係がある場合、各系列は、各データ系列の子ノードを持たない時系列ツリー (NODE_TYPE =16) 内に含まれます。回帰式のみが含まれます。ただし、リレーションシップが線形でない場合、ARTXP 時系列ツリーは、デシジョンツリーモデルと同様に、条件で子ノードに分割できます。 Microsoft 汎用コンテンツツリービューアーでモデルコンテンツを表示すると、分割が発生する場所と、それが傾向線にどのように影響するかを確認できます。

この動作をより深く理解するために、基本的なデータマイニングチュートリアルで作成された時系列モデルを確認できます。 AdventureWorks データウェアハウスに基づくこのモデルでは、特に複雑なデータは使用されません。したがって、ARTXP ツリーには分割が多くはありません。ただし、この比較的単純なモデルでも、次の 3 種類の分割が示されています。

太平洋地域の [Amount] 傾向線は、時間キーで分割されます。時間キーの分割は、特定の時点での傾向の変化があることを意味します。傾向線は特定の点まで直線的であり、その後、曲線は別の形状を想定していました。たとえば、1 つの時系列が 2002 年 8 月 6 日まで継続し、その日付より後に別の時系列が開始される場合があります。
北米リージョンの [Amount] 傾向線は、別の変数で分割されます。この場合、北米の傾向は、ヨーロッパ地域の同じモデルの値に基づいて分割されます。言い換えると、アルゴリズムは、ヨーロッパの値が変更されると、北米 A の値も変更されることを検出しました。
ヨーロッパ地域の傾向線は、それ自体で分割されます。

各分割の意味モデルコンテンツによって伝達される情報を解釈することは、ビジネスコンテキストにおけるデータとその意味を深く理解する必要がある芸術です。

北米とヨーロッパ地域の傾向間の明らかなリンクは、ヨーロッパのデータ系列のエントロピが高いため、北米の傾向が弱く見えるだけであることを示している可能性があります。または、2 つのスコアリングに大きな違いはなく、北米をコンピューティングする前のヨーロッパのコンピューティングに基づいて、相関関係が誤って発生する可能性があります。ただし、データを確認し、相関関係が誤っているかどうかを確認したり、他の要因が関係しているかどうかを調査したりすることもできます。
時間キーの分割は、線のグラデーションに統計的に有意な変化があることを意味します。これは、各範囲のサポートや分割に必要なエントロピの計算などの数学的要因によって発生した可能性があります。したがって、この分割は、現実の世界におけるモデルの意味の観点からは興味深くない可能性があります。ただし、分割で示された期間を確認すると、データに表されていない興味深い相関関係が見つかる場合があります。そのような販売促進や、その時点で開始されたその他のイベントは、データに影響を与えた可能性があります。

データに他の属性が含まれている場合は、ツリー内の分岐のより興味深い例が表示される可能性が非常に高くなります。たとえば、気象情報を追跡し、分析の属性として使用した場合、売上と気象の複雑な相互作用を表す複数の分割がツリーに表示されることがあります。

つまり、データマイニングは、潜在的に興味深い現象が発生する可能性のある場所に関するヒントを提供するのに役立ちますが、コンテキスト内の情報の価値を正確に解釈するには、ビジネスユーザーの詳細な調査と専門知識が必要です。

ARTXP 時系列式の要素

ARTXP ツリーまたはブランチの完全な数式を表示するには、Microsoft Time Series Viewer のマイニング凡例を使用することをお勧めします。このビューアーには、すべての定数が読み取り可能な形式で表示されます。

時系列モデルの数式を表示する (データマイニング)

次のセクションでは、数式の例を示し、基本的な用語について説明します。

ARTXP 数式のマイニング凡例

次の例は、 マイニング凡例に表示される、モデルの 1 つの部分の ARTXP 数式を示しています。この数式を表示するには、Microsoft Time Series ビューアーの基本的なデータマイニングチュートリアルで作成した [予測] モデルを開き、[ モデル ] タブをクリックし、R250: Europe データ系列のツリーを選択します。

この例で使用する数式を表示するには、2003 年 7 月 5 日以降の日付系列を表すノードをクリックします。

ツリーノードの方程式の例

Quantity = 21.322

-0.293 * 数量(R250 北米, -7) + 0.069 * 数量(R250 ヨーロッパ, -1) + 0.023 *

Quantity(R250 Europe,-3) -0.142 * Quantity(R750 Europe,-8)

この場合、値 21.322 は、式の次の要素の関数として Quantity に対して予測される値を表します。

たとえば、1 つの要素は Quantity(R250 North America,-7) です。北米地域における現在のタイムスライスの7つ前、つまりt-7の数量を指す表記です。このデータ系列の値に係数 -0.293 が乗算されます。各要素の係数は、トレーニングプロセス中に派生し、データの傾向に基づいています。

この式には複数の要素があります。これは、ヨーロッパ地域の R250 モデルの数量が他のいくつかのデータ系列の値に依存するとモデルが計算しているためです。

ARTXPフォーミュラのモデルコンテンツ

次の表は、 Microsoft 汎用コンテンツツリービューアー (データマイニング) に表示される関連ノードの内容を使用して、数式に関する同じ情報を示しています。

属性名	属性_値	サポート	変異	VALUETYPE
数量(R250 ヨーロッパ, y切片)	21.3223433563772	11	1.65508795539661	11 (インターセプト)
Quantity(Ｒ250 ヨーロッパ,-1)	0.0691694140876526	0	0	7 (係数)
数量(R250 Europe,-1)	20.6363635858123	0	182.380682874818	9 (統計)
数量(R750 Europe,-8)	-0.1421203048299	0	0	7 (係数)
数量(R750 ヨーロッパ,-8)	22.5454545333019	0	104.362130048408	9 (統計)
数量(R250 ヨーロッパ, -3)	0.0234095979448281	0	0	7 (係数)
数量(R250 Europe,-3)	24.8181818883176	0	176.475304989169	9 (統計)
数量(R250 北米, -7)	-0.292914186039869	0	0	7 (係数)
Quantity(R250 North America,-7)	10.36363640433	0	701.882534898676	9 (統計)

これらの例の比較からわかるように、マイニングモデルのコンテンツには、 マイニング凡例で使用できるのと同じ情報が含まれていますが、差異と サポートのための列が追加されています。サポートの値は、この式で説明されている傾向をサポートするケースの数を示します。

ARTXP 時系列数式の使用

ほとんどのビジネスユーザーにとって、ARTXP モデルコンテンツの価値は、ツリービューとデータの線形表現の両方を組み合わせたということです。

予測可能な属性の変更を独立変数の線形関数として表すことができる場合、アルゴリズムは回帰式を自動的に計算し、その系列を別のノードに出力します
リレーションシップを線形相関として表現できない場合は常に、時系列はデシジョンツリーのように分岐します。

Microsoft Time Series Viewer でモデルコンテンツを参照すると、分割が発生する場所と、それが傾向線にどのように影響するかを確認できます。

データ系列の任意の部分に対して時間と売上の間に直接的な相関関係が存在する場合、数式を取得する最も簡単な方法は、 マイニング凡例から数式をコピーし、それをドキュメントまたはプレゼンテーションに貼り付けてモデルを説明することです。または、そのツリーのNODE_DISTRIBUTION テーブルから平均値、係数、その他の情報を抽出し、それを使用して傾向の拡張を計算することもできます。系列全体が一貫した線形関係を示す場合、式は (All) ノードに含まれます。ツリーに分岐がある場合、式はリーフノードに含まれます。

次のクエリでは、マイニングモデルからすべての ARTXP リーフノードと、式を含む入れ子になったテーブルNODE_DISTRIBUTIONが返されます。

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,  
NODE_CAPTION,   
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE  
FROM NODE_DISTRIBUTION) as t  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 15

ARIMA ツリーについて

ARIMA モデルの各構造体は 、周期性 または 周期構造に対応します。定期的な構造は、データ系列全体で繰り返されるデータのパターンです。パターンの一部の小さなバリエーションは、統計的制限内で許可されます。周期性は、トレーニングデータで使用された既定の時間単位に従って測定されます。たとえば、トレーニングデータが各日の売上データを提供する場合、既定の時間単位は 1 日であり、すべての定期的な構造は指定された日数として定義されます。

アルゴリズムによって検出された各期間は、独自の構造ノードを取得します。たとえば、毎日の売上データを分析する場合、モデルは週を表す定期的な構造を検出する可能性があります。この場合、アルゴリズムは、完成したモデルに 2 つの定期的な構造を作成します。1 つは既定の 1 日の期間 ( {1}として示され、1 つは週)、1 つは {7} で示されます。

たとえば、次のクエリは、マイニングモデルからすべての ARIMA 構造体を返します。

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 27

結果の例:

MODEL_NAME	属性名	ノード名	NODE_TYPE	ノードキャプション
予測	M200 ヨーロッパ:数量	TA00000000	二十七	ARIMA (1,0,1)
予測	M200 北米:数量	TA00000001	二十七	ARIMA (1,0,4) X (1,1,4)(6)
予測	M200 Pacific:数量	TA00000002	二十七	ARIMA (2,0,8) X (1,0,0)(4)
予測	M200 Pacific:数量	TA00000002	二十七	ARIMA (2,0,8) X (1,0,0)(4)
予測	R250 ヨーロッパ:数量	TA00000003	二十七	ARIMA (1,0,7)
予測	R250 北米:数量	TA00000004	二十七	ARIMA (1,0,2)
予測	R250 Pacific:数量	TA00000005	二十七	ARIMA (2,0,2) X (1,1,2)(12)
予測	R750 ヨーロッパ:数量	TA00000006	二十七	ARIMA (2,1,1) X (1,1,5)(6)
予測	T1000 ヨーロッパ:数量	TA00000009	二十七	ARIMA (1,0,1)
予測	T1000 北米:数量	TA0000000a	二十七	ARIMA (1,1,1)
予測	T1`000 Pacific:Quantity	TA0000000b	二十七	ARIMA (1,0,3)

これらの結果から、 Microsoft 汎用コンテンツツリービューアー (データマイニング) を使用して参照することもできます。どの系列が完全に線形で、複数の周期構造を持ち、検出された周期性が何であるかを一目で確認できます。

たとえば、M200 Europe シリーズの ARIMA 数式の短い形式は、既定のサイクル (毎日) のみが検出されたことを示します。数式の短い形式は、NODE_CAPTION列に表示されます。

しかし、M200北米シリーズでは、追加の周期構造が見つかりました。ノード TA00000001には 2 つの子ノードがあり、1 つは数式 (1,0,4)、1 つは式 (1,1,4)(6) を持ちます。これらの数式は連結され、親ノードに表示されます。

各周期構造に対して、モデルコンテンツは順序と 移動平均 を子ノードとして提供します。たとえば、次のクエリは、前の例に示したノードの 1 つの子ノードを取得します。 PARENT_UNIQUE_NAME列は、同じ名前の予約済みキーワードと区別するために、角かっこで囲む必要があることに注意してください。

SELECT *   
FROM Forecasting.CONTENT  
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'

これは ARTXP ツリーではなく ARIMA ツリーであるため、 IsDescendant (DMX) 関数を使用してこの周期構造の子ノードを返すことはできません。代わりに、属性とノードの種類を使用して結果をフィルター処理し、移動平均や差の順序など、数式の作成方法の詳細を提供する子ノードを返すことができます。

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,  
NODE_TYPE,  NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'  
AND (NODE_TYPE = 29 or NODE_TYPE = 30)

結果の例:

MODEL_NAME	属性名	NODE_UNIQUE_NAME	ノードタイプ	ノードキャプション
予測	M200 北米:数量	TA00000001000000010	二十九	ARIMA {1,0.961832044807041}
予測	M200 北米:数量	TA00000001000000011	30	ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.220314343327742,-1.33151478258758}
予測	M200 北米:数量	TA00000001000000000	二十九	ARIMA {1,0.643565911081657}
予測	M200 北米:数量	TA00000001000000001	30	ARIMA {1,1.45035399809581E-02,-4.40489283927752E-02,-0.19203901352577,0.24220249764393}

これらの例は、ARIMA ツリーにドリルダウンすればするほど詳細が明らかになりますが、重要な情報が組み合わされ、親ノードにも表示されることを示しています。

ARIMA の時系列式

ARIMA ノードの完全な数式を表示するには、Microsoft Time Series Viewer のマイニング凡例を使用することをお勧めします。このビューアーには、自動回帰の順序、移動平均、および既に一貫した形式で構成されている数式のその他の要素が表示されます。

時系列モデルの数式を表示する (データマイニング)

このセクションでは、数式の例を示し、基本的な用語について説明します。

ARIMA 数式のマイニング凡例

次の例は、マイニング凡例に表示される、モデルの 1 つの部分の ARIMA 式を示しています。この数式を表示するには、Microsoft Time Series ビューアーを使用して予測モデルを開き、[モデル] タブをクリックし、R250: Europe データ系列のツリーを選択し、2003 年 7 月 5 日以降の日付系列を表すノードをクリックします。マイニング凡例は、次の例に示すように、すべての定数を読み取り可能な形式で構成します。

ARIMA 式:

ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889

この式は、係数と切片の値を含む長い ARIMA 形式です。この式の短い形式は {1,0,7}です。ここで、1 は期間をタイムスライスの数として示し、0 は用語の差の順序を示し、7 は係数の数を示します。

注

定数は分散を計算するために Analysis Services によって計算されますが、定数自体はユーザーインターフェイスのどこにも表示されません。ただし、[グラフ] ビューで [偏差の表示] を選択すると、系列内の任意の点の分散をこの定数の関数として表示できます。各データ系列のツールヒントには、特定の予測ポイントの差異が表示されます。

ARIMA 数式のモデルコンテンツ

ARIMA モデルは、さまざまな種類のノードに含まれる情報が異なる標準構造に従います。 ARIMA モデルのモデルコンテンツを表示するには、ビューアーを Microsoft 汎用コンテンツツリービューアーに変更し、属性名 R250 Europe: Quantity を持つノードを展開します。

データ系列の ARIMA モデルには、4 つの異なる形式の基本周期式が含まれています。これは、アプリケーションに応じて選択できます。

NODE_CAPTION: 数式の短い形式を表示します。短い形式は、表される周期構造の数と、それらが持つ係数の数を示します。たとえば、数式の短い形式が {4,0,6}場合、ノードは 6 つの係数を持つ 1 つの周期構造を表します。短い形式が {2,0,8} x {1,0,0}(4) のような場合、ノードには 2 つの周期構造が含まれます。

ノードの説明: 数式の長い形式を表示します。これは、 マイニング凡例に表示される数式の形式でもあります。数式の長い形式は短い形式に似ていますが、係数の実際の値はカウントされずに表示されます。

NODE_RULE: 数式の XML 表現を表示します。ノードの種類によっては、XML 表現に 1 つまたは複数の定期的な構造を含めることができます。次の表に、XML ノードを ARIMA モデルの上位レベルにロールアップする方法を示します。

ノードタイプ	XML コンテンツ
27 (ARIMA Root)	データ系列のすべての定期的な構造と、各周期構造のすべての子ノードの内容が含まれます。
28 (ARIMA 周期構造)	自己回帰項ノードとその移動平均係数を含む、1 つの周期構造を定義します。
29 (ARIMA Autoregressive)	1 つの周期構造の用語を一覧表示します。
30 (ARIMA 移動平均)	1 つの周期構造の係数を一覧表示します。

NODE_DISTRIBUTION: 入れ子になったテーブル内の数式の項を表示します。クエリを実行して特定の用語を取得できます。ノード分散テーブルは、XML ルールと同じ階層構造に従います。つまり、ARIMA 系列のルートノード (NODE_TYPE = 27) には、インターセプト値と、複数の周期性を含めることができる完全な方程式の周期性が含まれます。一方、子ノードには、特定の周期構造またはその周期構造の子ノードに固有の情報のみが含まれます。

ノードタイプ	特性	値の種類
27 (ARIMA Root)	遮る周期性	11
28 (ARIMA 周期構造)	周期性自動後退順序相違の順序移動平均の順序	12 13 15 14
29 (ARIMA Autoregressive)	係数 (係数の相補性)	7
30 (ARIMA 移動平均)	t の値 t-1 の値 ... t-n の値	7

移動平均オーダーの値は、系列内の移動平均の数を示します。一般に、移動平均は、系列に n 個の項がある場合は n-1 回計算されますが、計算を容易にするために数値を減らすことができます。

自動回帰の順序の値は、自動回帰系列の数を示します。

差の順序の値は、系列が比較される回数、または差が発生した回数を示します。

使用可能な値型の列挙については、「 Microsoft.AnalysisServices.AdomdServer.MiningValueType」を参照してください。

ARIMA ツリー情報の使用

ビジネスソリューションで ARIMA アルゴリズムに基づく予測を使用する場合は、式をレポートに貼り付けて、予測の作成に使用された方法を示します。キャプションを使用して数式を短い形式で表示するか、説明を使用して長い形式で数式を表示できます。

時系列予測を使用するアプリケーションを開発している場合は、モデルコンテンツから ARIMA 式を取得し、独自の予測を行うと便利な場合があります。特定の出力の ARIMA 式を取得するには、前の例に示すように、その特定の属性の ARIMA ルートを直接照会できます。

系列を含むノードの ID がわかっている場合は、数式のコンポーネントを取得する 2 つのオプションがあります。

入れ子になったテーブル形式: OLEDB クライアント経由で DMX クエリまたはクエリを使用します。
XML 表現: XML クエリを使用します。

注釈

各分割の情報はツリー内の異なる場所にあるため、ARTXP ツリーから情報を取得するのは困難な場合があります。したがって、ARTXP モデルでは、すべての部分を取得し、完全な数式を再構成するためにいくつかの処理を行う必要があります。 ARIMA モデルから数式を取得する方が簡単です。これは、ツリー全体で数式を使用できるようになったためです。この情報を取得するクエリを作成する方法については、「タイムシリーズモデルクエリの例」を参照してください。

こちらもご覧ください

マイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft タイムシリーズアルゴリズム
 タイムシリーズモデルクエリの例
 Microsoft タイムシリーズアルゴリズム技術リファレンス

Last updated on 2017-03-06