すべてのマイニング モデルは、同じ構造を使用してコンテンツを格納します。 この構造は、データ マイニング コンテンツ スキーマ行セットに従って定義されます。 ただし、その標準構造内では、情報を含むノードは、さまざまな種類のツリーを表すためにさまざまな方法で配置されます。 このトピックでは、Microsoft Time Series アルゴリズムに基づくマイニング モデルのノードの編成方法と各ノードの意味について説明します。
すべてのモデルの種類に適用される一般的なマイニング モデル コンテンツの説明については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
このトピックを確認するときは、時系列モデルの内容を参照すると便利な場合があります。 基本的なデータ マイニング チュートリアルを完了することで、時系列モデルを作成できます。 チュートリアルで作成するモデルは、ARIMA アルゴリズムと ARTXP アルゴリズムの両方を使用してデータをトレーニングする混合モデルです。 詳細については、「 予測構造とモデルの作成 (中間データ マイニング チュートリアル)」を参照してください。 マイニング モデルの内容を表示する方法については、「 データ マイニング モデル ビューアー」を参照してください。
時系列モデルの構造について
時系列モデルには、モデルとそのメタデータを表す単一の親ノードがあります。 その親ノードの下には、モデルの作成に使用したアルゴリズムに応じて、1 つまたは 2 つの時系列ツリーがあります。
混合モデルを作成すると、ARIMA 用と ARTXP 用の 2 つのツリーがモデルに追加されます。 ARTXP アルゴリズムのみを使用するか、ARIMA アルゴリズムのみを使用することを選択した場合、そのアルゴリズムに対応する単一のツリーが作成されます。 FORECAST_METHOD パラメーターを設定して、使用するアルゴリズムを指定します。 ARTXP、ARIMA、または混合モデルのどちらを使用するかの詳細については、「 Microsoft Time Series Algorithm」を参照してください。
次の図は、既定の設定で作成され、混合モデルを作成した時系列データ マイニング モデルの例を示しています。 2 つのモデルの違いをより簡単に比較できるように、ここでは ARTXP モデルが図の左側に表示され、ARIMA モデルが図の右側に表示されます。 ARTXP は、小さい分岐と小さい分岐に分割されるツリーのような構造ですが、ARIMA アルゴリズムによって作成される構造は、小さなコンポーネントから上に構築されたピラミッドに似ています。
覚えておくべき重要なポイントは、情報が ARIMA ツリーと ARTXP ツリー内にまったく異なる方法で配置されていることです。また、2 つのツリーはルート ノードでのみ関連していると見なす必要があります。 2 つの表現は便宜上 1 つのモデルで表示されますが、2 つの独立したモデルとして扱う必要があります。 ARTXP は実際のツリー構造を表しますが、ARIMA は表しません。
Microsoft 汎用モデル コンテンツ ツリー ビューアーを使用して ARIMA と ARTXP の両方を使用するモデルを表示すると、ARTXP モデルと ARIMA モデルのノードはすべて親時系列モデルの子ノードとして表示されます。 ただし、ノードに適用されるラベルによって簡単に区別できます。
ノードの最初のセットにはラベル (すべて) が付き、ARTXP アルゴリズムによる分析の結果を表します。
2 番目のノード セットには ARIMA というラベルが付き、ARIMA アルゴリズムによる分析結果が表されます。
警告
ARTXP ツリーの名前 (すべて) は、下位互換性のためにのみ保持されます。 SQL Server 2008 より前のバージョンでは、タイム シリーズ アルゴリズムでは、分析に単一のアルゴリズムである ARTXP アルゴリズムが使用されていました。
次のセクションでは、これらの各モデルの種類内でノードがどのように配置されるかについて説明します。
ARTXP モデルの構造
ARTXP アルゴリズムは、デシジョン ツリー モデルに似たモデルを作成します。 予測可能な属性をグループ化し、大きな違いが見つかるたびに分割します。 そのため、各 ARTXP モデルには、予測可能な属性ごとに個別の分岐が含まれています。 たとえば、基本的なデータ マイニング チュートリアルでは、複数のリージョンの売上を予測するモデルを作成します。 この場合、[ Amount] は予測可能な属性であり、リージョンごとに個別の分岐が作成されます。 予測可能な属性 が [Amount] と [Quantity] の 2 つある場合は、属性とリージョンの組み合わせごとに個別の分岐が作成されます。
ARTXP ブランチの最上位ノードには、デシジョン ツリー のルート ノードにあるのと同じ情報が含まれています。 これには、そのノードの子の数 (CHILDREN_CARDINALITY)、このノードの条件を満たすケースの数 (NODE_SUPPORT)、さまざまな説明統計 (NODE_DISTRIBUTION) が含まれます。
ノードに子がない場合は、ケースをさらにサブグループに分割することを正当化する重要な条件が見つからなかったことを意味します。 分岐はこの時点で終了し、ノードは リーフ ノードと呼ばれます。 リーフ ノードには、ARTXP 数式の構成要素である属性、係数、および値が含まれています。
一部のブランチには、デシジョン ツリー モデルと同様に、追加の分割が含まれる場合があります。 たとえば、ヨーロッパ地域の売上を表す木の枝分かれは、2つの枝に分かれます。 分割は、2 つのグループ間で大きな違いを引き起こす条件が見つかった場合に発生します。 親ノードは、[Amount]などの分割の原因となった属性の名前と、親ノードに存在するケースの数を示します。 リーフ ノードでは、属性の値 ([Sales] >10,000 と [Sales] < 10,000 など)、各条件をサポートするケースの数、および ARTXP 数式の詳細が提供されます。
注
数式を表示する場合は、リーフ ノード レベルで完全な回帰式を見つけることができますが、中間ノードまたはルート ノードでは見つかりません。
ARIMA モデルの構造
ARIMA アルゴリズムは、データ系列 ( [Region] など) と予測可能な属性 ([ Sales Amount] など) の組み合わせごとに 1 つの情報を作成します。これは、時間の経過に伴う予測可能な属性の変化を表す式です。
各系列の数式は、データ内で検出された周期構造ごとに 1 つずつ、複数のコンポーネントから派生します。 たとえば、月単位で収集される売上データがある場合、アルゴリズムは月単位、四半期単位、または年単位の定期的な構造を検出する可能性があります。
アルゴリズムは、検出された周期性ごとに、親ノードと子ノードの個別のセットを出力します。 1 つのタイム スライスの既定の周期性は 1 で、すべてのモデルに自動的に追加されます。 PERIODICITY_HINTパラメータに複数の値を入力することで、可能な周期構造を指定できます。 ただし、アルゴリズムが定期的な構造を検出しない場合、そのヒントの結果は出力されません。
モデル コンテンツで出力される各定期的な構造には、次のコンポーネント ノードが含まれています。
自動回帰順序 (AR) のノード
移動平均 (MA) のノード
これらの用語の意味については、「 Microsoft Time Series Algorithm」を参照してください。
差の順序は数式の重要な部分であり、式で表されます。 差異順序の使用方法の詳細については、「 Microsoft Time Series Algorithm Technical Reference」を参照してください。
時系列モデルの内容
このセクションでは、時系列モデルに特定の関連性を持つマイニング モデル コンテンツ内の列についてのみ、詳細と例を示します。
スキーマ行セットの汎用列 (MODEL_CATALOGやMODEL_NAMEなど) の詳細、またはマイニング モデルの用語の説明については、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
モデルカタログ
モデルが格納されているデータベースの名前。
MODEL_NAME
モデルの名前。
属性名
ノードで表されるデータ系列の予測可能な属性。 (MSOLAP_MODEL_COLUMNの場合と同じ値)。
ノード名
ノード名。
現在、この列には NODE_UNIQUE_NAME と同じ値が含まれていますが、これは将来のリリースで変更される可能性があります。
NODE_UNIQUE_NAME
ノードの一意の名前。 モデルの親ノードの名前は常に TS です。
ARTXP: 各ノードは TS の後に 16 進数の数値で表されます。 ノードの順序は重要ではありません。
たとえば、TS ツリーのすぐ下にある ARTXP ノードには、TS00000001-TS0000000b という番号が付けられます。
ARIMA: ARIMA ツリー内の各ノードは、TA とそれに続く 16 進数の数値で表されます。 子ノードには、親ノードの一意の名前の後に、ノード内のシーケンスを示す別の 16 進数が含まれています。
ARIMA ツリーはすべてまったく同じ構造になっています。 各ルートには、次の表に示すノードと名前付け規則が含まれています。
| ARIMA ノード ID と種類 | ノード名の例 |
|---|---|
| ARIMA 根 (27) | TA0000000b |
| ARIMA 周期構造 (28) | TA0000000b00000000 |
| ARIMA Auto Regressive (29) | TA0000000b00000000 |
| ARIMA 移動平均 (30) | TA0000000b00000001 |
NODE_TYPE
時系列モデルでは、アルゴリズムに応じて次のノードの種類が出力されます。
ARTXP:
| ノードの種類 ID | 説明 |
|---|---|
| 1 (モデル) | 時系列 |
| 3 (インテリア) | ARTXP 時系列ツリーの内部枝を示します。 |
| 16 (時系列ツリー) | 予測可能な属性と系列に対応する ARTXP ツリーのルート。 |
| 15 (時系列) | ARTXP ツリーのリーフ ノード。 |
ARIMA:
| ノードの種類 ID | 説明 |
|---|---|
| 27 (ARIMA Root) | ARIMA ツリーの最上位ノード。 |
| 28 (ARIMA 周期構造) | 1 つの周期構造を記述する ARIMA ツリーのコンポーネント。 |
| 29 (ARIMA Autoregressive) | 1 つの周期構造の係数を格納します。 |
| 30 (ARIMA 移動平均) | 1 つの周期構造の係数を格納します。 |
ノードキャプション
ノードに関連付けられているラベルまたはキャプション。
このプロパティは主に表示目的です。
ARTXP: 属性と値の範囲の組み合わせとして表示されるノードの分割条件が含まれます。
ARIMA: ARIMA 式の短い形式を含みます。
ARIMA 式の形式については、「ARIMA の マイニング凡例」を参照してください。
子供の基数
ノードに含まれる直接の子の数。
親ユニーク名
ノードの親の一意の名前。 ルート レベルのすべてのノードに対して NULL が返されます。
ノードの説明
現在のノードのルール、分割、または数式のテキスト内の説明。
ARTXP: 詳細については、「 ARTXP ツリーについて」を参照してください。
ARIMA: 詳細については、「 ARIMA ツリーについて」を参照してください。
ノードルール
現在のノード内のルール、分割、または数式の XML 記述。
ARTXP: NODE_RULEは通常、NODE_CAPTIONに対応します。
ARIMA: 詳細については、「 ARIMA ツリーについて」を参照してください。
限界規則
そのノードに固有の分割またはコンテンツの XML 記述。
ARTXP: MARGINAL_RULEは通常、NODE_DESCRIPTIONに対応します。
ARIMA: 常に空白。代わりにNODE_RULEを使用してください。
ノード確率
ARTXP: ツリー ノードの場合は、常に 1 です。 リーフ ノードの場合、モデル ルート ノードからノードに到達する確率。
ARIMA: 常に 0。
周辺確率
ARTXP: ツリー ノードの場合は、常に 1 です。 リーフノードにおける、直近の親ノードからそのノードに到達する確率。
ARIMA: 常に 0。
ノード配分
ノードの確率ヒストグラムを含むテーブル。 時系列モデルでは、この入れ子になったテーブルには、実際の回帰式を組み立てるために必要なすべてのコンポーネントが含まれています。
ARTXP ツリー内のノード分散テーブルの詳細については、「 ARTXP ツリーについて」を参照してください。
ARIMA ツリーのノード分布テーブルの詳細については、「 ARIMA ツリーについて」を参照してください。
読み取り可能な形式で構成されたすべての定数とその他のコンポーネントを表示する場合は、 タイム シリーズ ビューアーを使用し、ノードをクリックして、[ マイニング凡例] を開きます。
ノードサポート
このノードをサポートするケースの数。
ARTXP:(All) ノードの場合、ブランチに含まれるタイム スライスの合計数を示します。
ターミナル ノードの場合、NODE_CAPTIONによって記述される範囲に含まれるタイム スライスの数を示します。 ターミナル ノード内のタイム スライスの数は、常に分岐 (All) ノードのNODE_SUPPORT値に合計されます。
ARIMA: 現在の定期的な構造をサポートするケースの数。 サポートの値は、現在の周期構造のすべてのノードで繰り返されます。
MSOLAP_MODEL_COLUMN
ノードで表されるデータ系列の予測可能な属性。 (ATTRIBUTE_NAMEの場合と同じ値)。
MSOLAP_NODE_SCORE
ツリーまたは分割の情報値を特徴付けする数値。
ARTXP: 分割のないノードの場合、値は常に 0.0 です。 分割されたノードの場合、値は分割の興味深さのスコアを表します。
スコア付け方法の詳細については、「 特徴選択 (データ マイニング)」を参照してください。
ARIMA: ARIMA モデルのベイジアン情報抽出条件 (BIC) スコア。 数式に関連するすべての ARIMA ノードで同じスコアが設定されます。
MSOLAP_ノード_短いキャプション
ARTXP: NODE_DESCRIPTIONと同じ情報。
ARIMA: NODE_CAPTIONと同じ情報、つまり ARIMA 式の短い形式。
ARTXP ツリーについて
ARTXP モデルは、線形であるデータの領域と、他の要因で分割されたデータの領域を明確に分離します。 予測可能な属性の変更を独立変数の関数として直接表すことができる場合は、回帰式がそのリレーションシップを表すように計算されます。
たとえば、ほとんどのデータ系列で時間と売上の間に直接的な相関関係がある場合、各系列は、各データ系列の子ノードを持たない時系列ツリー (NODE_TYPE =16) 内に含まれます。回帰式のみが含まれます。 ただし、リレーションシップが線形でない場合、ARTXP 時系列ツリーは、デシジョン ツリー モデルと同様に、条件で子ノードに分割できます。 Microsoft 汎用コンテンツ ツリー ビューアーでモデル コンテンツを表示すると、分割が発生する場所と、それが傾向線にどのように影響するかを確認できます。
この動作をより深く理解するために、 基本的なデータ マイニング チュートリアルで作成された時系列モデルを確認できます。 AdventureWorks データ ウェアハウスに基づくこのモデルでは、特に複雑なデータは使用されません。 したがって、ARTXP ツリーには分割が多くはありません。 ただし、この比較的単純なモデルでも、次の 3 種類の分割が示されています。
太平洋地域の [Amount] 傾向線は、時間キーで分割されます。 時間キーの分割は、特定の時点での傾向の変化があることを意味します。 傾向線は特定の点まで直線的であり、その後、曲線は別の形状を想定していました。 たとえば、1 つの時系列が 2002 年 8 月 6 日まで継続し、その日付より後に別の時系列が開始される場合があります。
北米リージョンの [Amount] 傾向線は、別の変数で分割されます。 この場合、北米の傾向は、ヨーロッパ地域の同じモデルの値に基づいて分割されます。 言い換えると、アルゴリズムは、ヨーロッパの値が変更されると、北米 A の値も変更されることを検出しました。
ヨーロッパ地域の傾向線は、それ自体で分割されます。
各分割の意味 モデル コンテンツによって伝達される情報を解釈することは、ビジネス コンテキストにおけるデータとその意味を深く理解する必要がある芸術です。
北米とヨーロッパ地域の傾向間の明らかなリンクは、ヨーロッパのデータ系列のエントロピが高いため、北米の傾向が弱く見えるだけであることを示している可能性があります。 または、2 つのスコアリングに大きな違いはなく、北米をコンピューティングする前のヨーロッパのコンピューティングに基づいて、相関関係が誤って発生する可能性があります。 ただし、データを確認し、相関関係が誤っているかどうかを確認したり、他の要因が関係しているかどうかを調査したりすることもできます。
時間キーの分割は、線のグラデーションに統計的に有意な変化があることを意味します。 これは、各範囲のサポートや分割に必要なエントロピの計算などの数学的要因によって発生した可能性があります。 したがって、この分割は、現実の世界におけるモデルの意味の観点からは興味深くない可能性があります。 ただし、分割で示された期間を確認すると、データに表されていない興味深い相関関係が見つかる場合があります。そのような販売促進や、その時点で開始されたその他のイベントは、データに影響を与えた可能性があります。
データに他の属性が含まれている場合は、ツリー内の分岐のより興味深い例が表示される可能性が非常に高くなります。 たとえば、気象情報を追跡し、分析の属性として使用した場合、売上と気象の複雑な相互作用を表す複数の分割がツリーに表示されることがあります。
つまり、データ マイニングは、潜在的に興味深い現象が発生する可能性のある場所に関するヒントを提供するのに役立ちますが、コンテキスト内の情報の価値を正確に解釈するには、ビジネス ユーザーの詳細な調査と専門知識が必要です。
ARTXP 時系列式の要素
ARTXP ツリーまたはブランチの完全な数式を表示するには、Microsoft Time Series Viewer のマイニング凡例を使用することをお勧めします。このビューアーには、すべての定数が読み取り可能な形式で表示されます。
次のセクションでは、数式の例を示し、基本的な用語について説明します。
ARTXP 数式のマイニング凡例
次の例は、 マイニング凡例に表示される、モデルの 1 つの部分の ARTXP 数式を示しています。 この数式を表示するには、Microsoft Time Series ビューアーの基本的なデータ マイニング チュートリアルで作成した [予測] モデルを開き、[ モデル ] タブをクリックし、R250: Europe データ 系列のツリーを選択します。
この例で使用する数式を表示するには、2003 年 7 月 5 日以降の日付系列を表すノードをクリックします。
ツリーノードの方程式の例
Quantity = 21.322
-0.293 * 数量(R250 北米, -7) + 0.069 * 数量(R250 ヨーロッパ, -1) + 0.023 *
Quantity(R250 Europe,-3) -0.142 * Quantity(R750 Europe,-8)
この場合、値 21.322 は、式の次の要素の関数として Quantity に対して予測される値を表します。
たとえば、1 つの要素は Quantity(R250 North America,-7) です。 北米地域における現在のタイムスライスの7つ前、つまりt-7の数量を指す表記です。 このデータ系列の値に係数 -0.293 が乗算されます。 各要素の係数は、トレーニング プロセス中に派生し、データの傾向に基づいています。
この式には複数の要素があります。これは、ヨーロッパ地域の R250 モデルの数量が他のいくつかのデータ系列の値に依存するとモデルが計算しているためです。
ARTXPフォーミュラのモデルコンテンツ
次の表は、 Microsoft 汎用コンテンツ ツリー ビューアー (データ マイニング) に表示される関連ノードの内容を使用して、数式に関する同じ情報を示しています。
| 属性名 | 属性_値 | サポート | 確率 | 変異 | VALUETYPE |
|---|---|---|---|---|---|
| 数量(R250 ヨーロッパ, y切片) | 21.3223433563772 | 11 | 0 | 1.65508795539661 | 11 (インターセプト) |
| Quantity(R250 ヨーロッパ,-1) | 0.0691694140876526 | 0 | 0 | 0 | 7 (係数) |
| 数量(R250 Europe,-1) | 20.6363635858123 | 0 | 0 | 182.380682874818 | 9 (統計) |
| 数量(R750 Europe,-8) | -0.1421203048299 | 0 | 0 | 0 | 7 (係数) |
| 数量(R750 ヨーロッパ,-8) | 22.5454545333019 | 0 | 0 | 104.362130048408 | 9 (統計) |
| 数量(R250 ヨーロッパ, -3) | 0.0234095979448281 | 0 | 0 | 0 | 7 (係数) |
| 数量(R250 Europe,-3) | 24.8181818883176 | 0 | 0 | 176.475304989169 | 9 (統計) |
| 数量(R250 北米, -7) | -0.292914186039869 | 0 | 0 | 0 | 7 (係数) |
| Quantity(R250 North America,-7) | 10.36363640433 | 0 | 0 | 701.882534898676 | 9 (統計) |
これらの例の比較からわかるように、マイニング モデルのコンテンツには、 マイニング凡例で使用できるのと同じ情報が含まれていますが、 差異 と サポートのための列が追加されています。 サポートの値は、この式で説明されている傾向をサポートするケースの数を示します。
ARTXP 時系列数式の使用
ほとんどのビジネス ユーザーにとって、ARTXP モデル コンテンツの価値は、ツリー ビューとデータの線形表現の両方を組み合わせたということです。
予測可能な属性の変更を独立変数の線形関数として表すことができる場合、アルゴリズムは回帰式を自動的に計算し、その系列を別のノードに出力します
リレーションシップを線形相関として表現できない場合は常に、時系列はデシジョン ツリーのように分岐します。
Microsoft Time Series Viewer でモデル コンテンツを参照すると、分割が発生する場所と、それが傾向線にどのように影響するかを確認できます。
データ系列の任意の部分に対して時間と売上の間に直接的な相関関係が存在する場合、数式を取得する最も簡単な方法は、 マイニング凡例から数式をコピーし、それをドキュメントまたはプレゼンテーションに貼り付けてモデルを説明することです。 または、そのツリーのNODE_DISTRIBUTION テーブルから平均値、係数、その他の情報を抽出し、それを使用して傾向の拡張を計算することもできます。 系列全体が一貫した線形関係を示す場合、式は (All) ノードに含まれます。 ツリーに分岐がある場合、式はリーフ ノードに含まれます。
次のクエリでは、マイニング モデルからすべての ARTXP リーフ ノードと、式を含む入れ子になったテーブルNODE_DISTRIBUTIONが返されます。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,
NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 15
ARIMA ツリーについて
ARIMA モデルの各構造体は 、周期性 または 周期構造に対応します。 定期的な構造は、データ系列全体で繰り返されるデータのパターンです。 パターンの一部の小さなバリエーションは、統計的制限内で許可されます。 周期性は、トレーニング データで使用された既定の時間単位に従って測定されます。 たとえば、トレーニング データが各日の売上データを提供する場合、既定の時間単位は 1 日であり、すべての定期的な構造は指定された日数として定義されます。
アルゴリズムによって検出された各期間は、独自の構造ノードを取得します。 たとえば、毎日の売上データを分析する場合、モデルは週を表す定期的な構造を検出する可能性があります。 この場合、アルゴリズムは、完成したモデルに 2 つの定期的な構造を作成します。1 つは既定の 1 日の期間 ( {1}として示され、1 つは週)、1 つは {7} で示されます。
たとえば、次のクエリは、マイニング モデルからすべての ARIMA 構造体を返します。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 27
結果の例:
| MODEL_NAME | 属性名 | ノード名 | NODE_TYPE | ノードキャプション |
|---|---|---|---|---|
| 予測 | M200 ヨーロッパ:数量 | TA00000000 | 二十七 | ARIMA (1,0,1) |
| 予測 | M200 北米:数量 | TA00000001 | 二十七 | ARIMA (1,0,4) X (1,1,4)(6) |
| 予測 | M200 Pacific:数量 | TA00000002 | 二十七 | ARIMA (2,0,8) X (1,0,0)(4) |
| 予測 | M200 Pacific:数量 | TA00000002 | 二十七 | ARIMA (2,0,8) X (1,0,0)(4) |
| 予測 | R250 ヨーロッパ:数量 | TA00000003 | 二十七 | ARIMA (1,0,7) |
| 予測 | R250 北米:数量 | TA00000004 | 二十七 | ARIMA (1,0,2) |
| 予測 | R250 Pacific:数量 | TA00000005 | 二十七 | ARIMA (2,0,2) X (1,1,2)(12) |
| 予測 | R750 ヨーロッパ:数量 | TA00000006 | 二十七 | ARIMA (2,1,1) X (1,1,5)(6) |
| 予測 | T1000 ヨーロッパ:数量 | TA00000009 | 二十七 | ARIMA (1,0,1) |
| 予測 | T1000 北米:数量 | TA0000000a | 二十七 | ARIMA (1,1,1) |
| 予測 | T1`000 Pacific:Quantity | TA0000000b | 二十七 | ARIMA (1,0,3) |
これらの結果から、 Microsoft 汎用コンテンツ ツリー ビューアー (データ マイニング) を使用して参照することもできます。どの系列が完全に線形で、複数の周期構造を持ち、検出された周期性が何であるかを一目で確認できます。
たとえば、M200 Europe シリーズの ARIMA 数式の短い形式は、既定のサイクル (毎日) のみが検出されたことを示します。 数式の短い形式は、NODE_CAPTION列に表示されます。
しかし、M200北米シリーズでは、追加の周期構造が見つかりました。 ノード TA00000001には 2 つの子ノードがあり、1 つは数式 (1,0,4)、1 つは式 (1,1,4)(6) を持ちます。 これらの数式は連結され、親ノードに表示されます。
各周期構造に対して、モデルコンテンツは 順序 と 移動平均 を子ノードとして提供します。 たとえば、次のクエリは、前の例に示したノードの 1 つの子ノードを取得します。 PARENT_UNIQUE_NAME列は、同じ名前の予約済みキーワードと区別するために、角かっこで囲む必要があることに注意してください。
SELECT *
FROM Forecasting.CONTENT
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'
これは ARTXP ツリーではなく ARIMA ツリーであるため、 IsDescendant (DMX) 関数を使用してこの周期構造の子ノードを返すことはできません。 代わりに、属性とノードの種類を使用して結果をフィルター処理し、移動平均や差の順序など、数式の作成方法の詳細を提供する子ノードを返すことができます。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,
NODE_TYPE, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'
AND (NODE_TYPE = 29 or NODE_TYPE = 30)
結果の例:
| MODEL_NAME | 属性名 | NODE_UNIQUE_NAME | ノードタイプ | ノードキャプション |
|---|---|---|---|---|
| 予測 | M200 北米:数量 | TA00000001000000010 | 二十九 | ARIMA {1,0.961832044807041} |
| 予測 | M200 北米:数量 | TA00000001000000011 | 30 | ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.220314343327742,-1.33151478258758} |
| 予測 | M200 北米:数量 | TA00000001000000000 | 二十九 | ARIMA {1,0.643565911081657} |
| 予測 | M200 北米:数量 | TA00000001000000001 | 30 | ARIMA {1,1.45035399809581E-02,-4.40489283927752E-02,-0.19203901352577,0.24220249764393} |
これらの例は、ARIMA ツリーにドリルダウンすればするほど詳細が明らかになりますが、重要な情報が組み合わされ、親ノードにも表示されることを示しています。
ARIMA の時系列式
ARIMA ノードの完全な数式を表示するには、Microsoft Time Series Viewer のマイニング凡例を使用することをお勧めします。このビューアーには、自動回帰の順序、移動平均、および既に一貫した形式で構成されている数式のその他の要素が表示されます。
このセクションでは、数式の例を示し、基本的な用語について説明します。
ARIMA 数式のマイニング凡例
次の例は、マイニング凡例に表示される、モデルの 1 つの部分の ARIMA 式を示しています。 この数式を表示するには、Microsoft Time Series ビューアーを使用して予測モデルを開き、[モデル] タブをクリックし、R250: Europe データ系列のツリーを選択し、2003 年 7 月 5 日以降の日付系列を表すノードをクリックします。 マイニング凡例は、次の例に示すように、すべての定数を読み取り可能な形式で構成します。
ARIMA 式:
ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889
この式は、係数と切片の値を含む長い ARIMA 形式です。 この式の短い形式は {1,0,7}です。ここで、1 は期間をタイム スライスの数として示し、0 は用語の差の順序を示し、7 は係数の数を示します。
注
定数は分散を計算するために Analysis Services によって計算されますが、定数自体はユーザー インターフェイスのどこにも表示されません。 ただし、[グラフ] ビューで [偏差の表示] を選択すると、系列内の任意の点の分散をこの定数の関数として表示できます。 各データ系列のツールヒントには、特定の予測ポイントの差異が表示されます。
ARIMA 数式のモデル コンテンツ
ARIMA モデルは、さまざまな種類のノードに含まれる情報が異なる標準構造に従います。 ARIMA モデルのモデル コンテンツを表示するには、ビューアーを Microsoft 汎用コンテンツ ツリー ビューアーに変更し、属性名 R250 Europe: Quantity を持つノードを展開します。
データ系列の ARIMA モデルには、4 つの異なる形式の基本周期式が含まれています。これは、アプリケーションに応じて選択できます。
NODE_CAPTION: 数式の短い形式を表示します。 短い形式は、表される周期構造の数と、それらが持つ係数の数を示します。 たとえば、数式の短い形式が {4,0,6}場合、ノードは 6 つの係数を持つ 1 つの周期構造を表します。 短い形式が {2,0,8} x {1,0,0}(4) のような場合、ノードには 2 つの周期構造が含まれます。
ノードの説明: 数式の長い形式を表示します。これは、 マイニング凡例に表示される数式の形式でもあります。 数式の長い形式は短い形式に似ていますが、係数の実際の値はカウントされずに表示されます。
NODE_RULE: 数式の XML 表現を表示します。 ノードの種類によっては、XML 表現に 1 つまたは複数の定期的な構造を含めることができます。 次の表に、XML ノードを ARIMA モデルの上位レベルにロールアップする方法を示します。
| ノード タイプ | XML コンテンツ |
|---|---|
| 27 (ARIMA Root) | データ系列のすべての定期的な構造と、各周期構造のすべての子ノードの内容が含まれます。 |
| 28 (ARIMA 周期構造) | 自己回帰項ノードとその移動平均係数を含む、1 つの周期構造を定義します。 |
| 29 (ARIMA Autoregressive) | 1 つの周期構造の用語を一覧表示します。 |
| 30 (ARIMA 移動平均) | 1 つの周期構造の係数を一覧表示します。 |
NODE_DISTRIBUTION: 入れ子になったテーブル内の数式の項を表示します。クエリを実行して特定の用語を取得できます。 ノード分散テーブルは、XML ルールと同じ階層構造に従います。 つまり、ARIMA 系列のルート ノード (NODE_TYPE = 27) には、インターセプト値と、複数の周期性を含めることができる完全な方程式の周期性が含まれます。一方、子ノードには、特定の周期構造またはその周期構造の子ノードに固有の情報のみが含まれます。
| ノード タイプ | 特性 | 値の種類 |
|---|---|---|
| 27 (ARIMA Root) | 遮る 周期性 |
11 |
| 28 (ARIMA 周期構造) | 周期性 自動後退順序 相違の順序 移動平均の順序 |
12 13 15 14 |
| 29 (ARIMA Autoregressive) | 係数 (係数の相補性) |
7 |
| 30 (ARIMA 移動平均) | t の値 t-1 の値 ... t-n の値 |
7 |
移動平均オーダーの値は、系列内の移動平均の数を示します。 一般に、移動平均は、系列に n 個の項がある場合は n-1 回計算されますが、計算を容易にするために数値を減らすことができます。
自動回帰の順序の値は、自動回帰系列の数を示します。
差の順序の値は、系列が比較される回数、または差が発生した回数を示します。
使用可能な値型の列挙については、「 Microsoft.AnalysisServices.AdomdServer.MiningValueType」を参照してください。
ARIMA ツリー情報の使用
ビジネス ソリューションで ARIMA アルゴリズムに基づく予測を使用する場合は、式をレポートに貼り付けて、予測の作成に使用された方法を示します。 キャプションを使用して数式を短い形式で表示するか、説明を使用して長い形式で数式を表示できます。
時系列予測を使用するアプリケーションを開発している場合は、モデル コンテンツから ARIMA 式を取得し、独自の予測を行うと便利な場合があります。 特定の出力の ARIMA 式を取得するには、前の例に示すように、その特定の属性の ARIMA ルートを直接照会できます。
系列を含むノードの ID がわかっている場合は、数式のコンポーネントを取得する 2 つのオプションがあります。
入れ子になったテーブル形式: OLEDB クライアント経由で DMX クエリまたはクエリを使用します。
XML 表現: XML クエリを使用します。
注釈
各分割の情報はツリー内の異なる場所にあるため、ARTXP ツリーから情報を取得するのは困難な場合があります。 したがって、ARTXP モデルでは、すべての部分を取得し、完全な数式を再構成するためにいくつかの処理を行う必要があります。 ARIMA モデルから数式を取得する方が簡単です。これは、ツリー全体で数式を使用できるようになったためです。 この情報を取得するクエリを作成する方法については、「 タイム シリーズ モデル クエリの例」を参照してください。
こちらもご覧ください
マイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft タイム シリーズ アルゴリズム
タイム シリーズ モデル クエリの例
Microsoft タイム シリーズ アルゴリズム技術リファレンス