Podczas badania modelu czasu serii (Analysis Services — wyszukiwanie danych)
Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć albo zawartości kwerendę, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie, która używa desenie w modelu, aby prognoz dla nowych danych.Na przykład kwerendy zawartości dla modelu serii czas może zawierać dodatkowe informacje szczegółowe na temat struktury okresowych, które zostały wykryte, podczas gdy kwerendy przewidywanie może dać prognoz dla następnego wycinki czas 5-10.Można również pobierać metadane dotyczące modelu przy użyciu kwerendy.
W tej sekcji wyjaśniono, jak utworzyć oba rodzaje kwerendy dla modeli, które są oparte na algorytmie seria czas firmy Microsoft.
Kwerendy zawartości
Trwa pobieranie okresowości wskazówki dla modelu
Trwa pobieranie równanie modelem ARIMA
Trwa pobieranie równanie modelem ARTxp
Kwerendy przewidywanie
Tworzenie prognoz z EXTEND_MODEL_CASES
Tworzenie prognoz z REPLACE_MODEL_CASES
Praca z brakujących wartości.
Kwerendy zawartości na modelu czas serii
Model zawartości kwerendy może zapewnić podstawowe informacje o modelu, takie jak parametry, które były używane podczas tworzenia modelu, czas ostatniego przetworzenia modelu.Poniższy przykład przedstawia podstawową składnię kwerendy zawartości modelu za pomocą zestawów wierszy schematu wyszukiwanie danych.
Powrót do początku
Przykładowa kwerenda 1: Trwa pobieranie okresowości wskazówki dla modelu
Możesz pobrać terminy, które zostały znalezione w ramach czas serii za pomocą kwerend wysyłanych do ARIMA drzewo lub drzewa ARTxp.Jednak terminy w wypełnionych modelu może nie być taka sama, jak okresów, dla których został określony jako wskazówki podczas tworzenia modelu.W celu pobrania wskazówek, które zostały dostarczone jako parametry podczas tworzenia modelu, można wysyłać kwerendy wyszukiwania zawartości schematu modelu z zestawu zestaw wierszy za pomocą następującej instrukcja DMX:
SELECT MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = '<model name>'
Częściowe wyniki:
MINING_PARAMETERS |
|---|
COMPLEXITY_PENALTY = 0,1, MINIMUM_SUPPORT = 10 PERIODICITY_HINT = {1,3} …. |
Wskazówka okresowości domyślny to {1} i pojawia się we wszystkich modelach; model ten przykładowy został utworzony za pomocą dodatkowe wskazówki, które nie mogą znajdować się w końcowej modelu.
Uwaga
Wyniki są zostały obcięte w tym miejscu aby zwiększyć czytelność.
Powrót do początku
Przykładowa kwerenda 2: Trwa pobieranie równanie modelu ARIMA
Równanie dla średniej z modelu ARIMA można pobrać za pomocą kwerend wysyłanych do dowolnego węzła w drzewie poszczególnych.Należy pamiętać, że każdego drzewa w modelu typu ARIMA reprezentuje inny okresowości i w przypadku wielu serii danych, każdej serii danych będzie mieć własny zestaw okresowości drzew.W związku z tym w celu pobrania równanie serii danych należy określić drzewo najpierw.
Na przykład prefiks TA informuje, że węzeł jest części drzewa ARIMA prefiks usług TERMINALOWYCH jest stosowana dla ARTXP drzew.Wykonywanie kwerendy zawartości modelu dla węzłów o wartości 27 NODE_TYPE znaleźć wszystkie ARIMA katalogu głównego drzewa.Umożliwia także wartość ATTRIBUTE_NAME znaleźć węzła głównego ARIMA dla serii danych.W tym przykładzie kwerendy znajduje węzłów ARIMA, które reprezentują ilości sprzedanych modelu R250 w Europie region.
SELECT NODE_UNIQUE_NAME
FROM Forecasting.CONTENT
WHERE ATTRIBUTE_NAME = 'R250 Europe: Quantity"
AND NODE_TYPE = 27
Przy użyciu węzła o tej NAZWIE, można pobrać informacji o ARIMA równanie tego drzewa.Poniższa instrukcja DMX pobiera skróconej formy ARIMA równanie serii danych.Pobiera także punktu przecięcia z osią, z tabela zagnieżdżonej NODE_DISTRIBUTION.W tym przykładzie równanie uzyskuje się przez odwoływanie się do węzła TA00000007 unikatowy identyfikator.Jednak może być konieczne użycie IDENTYFIKATORA innego węzła, a nieco inne wyniki mogą otrzymać z modelu.
SELECT FLATTENED NODE_CAPTION as [Short equation],
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE
FROM NODE_DISTRIBUTION) as t
FROM Forecasting.CONTENT
WHERE NODE_NAME = 'TA00000007'
Przykład wyniki:
Krótkie równania |
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
|---|---|---|
ARIMA (2,0,7)x(1,0,2)(12) |
Europe:Quantity(Intercept) R250 |
15.24…. |
ARIMA (2,0,7)x(1,0,2)(12) |
Europe:Quantity(Periodicity) R250 |
1 |
ARIMA (2,0,7)x(1,0,2)(12) |
Europe:Quantity(Periodicity) R250 |
12 |
Aby uzyskać więcej informacji dotyczących sposobu interpretowania tych informacji zobacz model wyszukiwania Zawartości dla czasu seria modele (Analysis Services — wyszukiwanie danych).
Powrót do początku
Przykładowa kwerenda 3: Trwa pobieranie równanie modelu ARTxp
W przypadku modelu ARTxp różne informacje są przechowywane na każdym poziomie drzewa.Aby uzyskać więcej informacji na temat struktury modelu typu ARTxp oraz sposób interpretowania informacji w równaniu zobacz model wyszukiwania Zawartości dla czasu seria modele (Analysis Services — wyszukiwanie danych).
Poniższa instrukcja DMX pobiera informacje o części drzewa ARTxp, która reprezentuje ilość sprzedaży dla modelu R250 w Europie.
Uwaga
Nazwa kolumna tabela zagnieżdżonej, Odchylenie względem, muszą być ujęte w nawiasy, aby odróżnić go od zarezerwowanym słowem kluczowym o takiej samej nazwie.Kolumny tabela zagnieżdżonej, prawdopodobieństwo i SUPPORT, nie są włączone, ponieważ są one puste, w większości przypadków.
SELECT NODE_CAPTION as [Split information],
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE,
[VARIANCE]
FROM NODE_DISTRIBUTION) AS t
FROM Forecasting.CONTENT
WHERE NODE_ATTRIBUTE_NAME = 'R250 Europe:Quantity'
AND NODE_TYPE = 15
Aby uzyskać więcej informacji dotyczących sposobu interpretowania tych informacji zobacz model wyszukiwania Zawartości dla czasu seria modele (Analysis Services — wyszukiwanie danych).
Powrót do początku
Kwerendy przewidywanie na modelu czas serii
W SQL Server 2008 Enterprise, można dodać nowe dane do modelu serii czas i automatycznie dołączyć nowe dane do modelu. Dodać nowe dane do modelu czas serii wyszukiwania w jednym z dwóch sposobów:
Użycie PREDICTION JOIN Aby dołączyć dane w zewnętrznym źródłem danych szkoleniowych.
Za pomocą kwerendy przewidywanie pojedynczych zapewniające część jeden na czas.Aby uzyskać informacje na temat tworzenia kwerendy przewidywanie pojedynczych zobacz Tworzenie DMX przewidywanie kwerendy.
Podczas dodawania nowych danych do modelu serii czas, można określić, czy rozszerzania lub zamiany danych szkolenie:
Po rozszerzeniu danych, Analysis Services Dodaje nowe dane na końcu istniejących danych szkoleniowych. Zwiększa liczbę przypadków szkolenia.Rozszerzanie modelu przypadków jest przydatne w przypadku stale aktualizowania modelu z nowymi danymi.
Aby rozszerzyć dane, należy utworzyć PREDICTION JOIN na czas modelu serii, określ urządzenie źródłowe nowych danych, a następnie użyj EXTEND_MODEL_CASES argument.
Jeżeli zastąpienie danych, Analysis Services zachowuje wyszkolonych modelu, ale korzysta z nowych danych do zastąpienia niektórych lub wszystkich istniejących szkolenia przypadkach. W związku z tym nigdy nie zmienia się rozmiar danych szkolenia, ale same przypadkach stale są zastępowane są przez nowsze dane.Jeśli zostanie podane za mało nowych danych, można zastąpić danych szkolenia całkowicie nowe serie.
Zastępowanie przypadkach modelu jest przydatne, należy przeszkolić modelu na jeden zestaw spraw, a następnie zastosować modelu do serii danych.
Aby zamienić dane, należy utworzyć PREDICTION JOIN na czas modelu serii, określ urządzenie źródłowe nowych danych, a następnie użyj REPLACE_MODEL_CASES argument.
Podczas dodawania nowych danych, nie można wprowadzać historycznych prognoz.Ponadto, niezależnie od rozszerzenia czy zastąpić dane szkolenia, prognoz zawsze rozpoczynać czas sygnatura kończy się oryginalny zestaw szkoleniowy.W związku z tym jeśli nowe dane zawierają wycinki n czas i zażądać prognoz dla czas kroki od 1 do n, prognoz będzie pokrywa się z tym samym okresie, w nowych danych.Aby uzyskać nowe prognoz dla okresów czasu, nie obejmuje danych, należy albo uruchomić prognoz w czasie część n + 1 po nowej serii danych lub upewnij się, że żądanie jest dodatkowy czas część s.
Na przykład załóżmy, że istniejący model zawiera sześć miesięcy, przez jaką danych.Który chcesz rozszerzyć ten model przez dodanie wartości sprzedaży z ostatnich trzech miesięcy.W tym samym czasie który ma być przewidywanie dotyczące następnych miesięcy.Aby uzyskać tylko nowe prognoz podczas dodawania nowych danych, należy określić punkt początkowy jako przedział czas 4, a punkt końcowy jako przedział czas 7.Łącznie sześć prognoz również może żądać, ale wycinki czas dla pierwszych trzech nałożyłby się z nowymi danymi, które są właśnie dodany.
Przykładowe kwerendy i dowiedzieć się więcej na temat składni przy użyciu REPLACE_MODEL_CASES i EXTEND_MODEL_CASES, zobacz PredictTimeSeries (DMX).
Powrót do początku
Tworzenie prognoz z EXTEND_MODEL_CASES
przewidywanie zachowania różni się w zależności od tego, czy rozszerzenie lub zastąpić przypadkach modelu.Rozszerzenie modelu nowe dane są dołączane do zakończenia tej serii i rozmiar szkolenia zestaw zwiększa się.Jednak wycinki czas używany do przewidywanie kwerendy zawsze rozpoczynać na końcu oryginalnej serii.W związku z tym jeśli dodać trzy nowe punkty danych i zażądać sześć prognoz, prognoz pierwsze trzy zwracane nakładania się przy użyciu nowych danych.W takim przypadek Analysis Services Zwraca wartość rzeczywista nowe punkty danych, zamiast dokonywania przewidywanie, dopóki wszystkie nowe punkty danych są używane w. Następnie, Analysis Services powoduje, że na podstawie serii złożonych prognoz.
To zachowanie umożliwia dodawanie nowych danych, a następnie wyświetlić rzeczywiste dane dotyczące sprzedaży na wykresie przewidywanie, zamiast prognoz.
Na przykład aby dodać trzy nowe punkty danych i trzy nowe przewidywania, czy wykonaj następujące czynności:
Utwórz PREDICTION JOIN na czas serii modelu, a następnie określ urządzenie źródłowe trzech miesięcy nowych danych.
Żądanie prognoz dla sześciu wycinki czas.W tym celu należy określić 6 czas część s, gdzie punkt początkowy jest czas część 1, a punkt końcowy jest czas część 7.Ta zasada obowiązuje tylko w przypadku EXTEND_MODEL_CASES.
Aby pobrać tylko nowe prognoz, należy określić punkt początkowy jako 4 i punkt końcowy jak 7.
Należy użyć argumentu EXTEND_MODEL_CASES.
Zwracane są rzeczywiste wartości sprzedaży, pierwsze trzy raz wycinki, i prognoz opartych na modelu rozszerzone są zwracane dla następnego czas trzy wycinki.
Powrót do początku
Tworzenie prognoz z REPLACE_MODEL_CASES
Po zamianie przypadki, w modelu rozmiar modelu pozostaje ten sam ale Analysis Services zastępuje indywidualnych przypadkach w modelu. Jest to przydatne podczas przeładunku-przewidywanie i scenariusze, w których utrzymywanie ważne jest szkolenie zestaw danych i rozmiar zgodne.
Na przykład jeden z magazynów ma niewystarczające dane dotyczące sprzedaży.Obliczanie wartości średniej sprzedaży dla wszystkich magazynów w określonym regionie, a następnie szkolenia modelu, można utworzyć głównej modelu.Następnie aby prognoz dla magazynu bez wystarczających danych dotyczących sprzedaży, można utworzyć PREDICTION JOIN na nowych danych sprzedaży tylko z tego magazynu. Gdy to zrobisz, Analysis Services zachowuje wzorców pochodzących z modelu regionalnych, ale zastępuje istniejące przypadkach szkolenia z danymi z pojedynczego magazynu. W rezultacie przewidywanie wartości będą bliżej linii trend dla poszczególnych magazynu.
Po użyciu REPLACE_MODEL_CASES argument, Analysis Services stale dodaje nowe przypadkach końcu zestaw liter i usuwa odpowiedni numer od początku zestawu przypadek. Jeśli dodasz więcej nowych danych, niż w oryginalny zestaw szkoleniowy Analysis Services odrzuca najwcześniejszą dane. Jeśli zostanie podane wystarczające nowe wartości, prognoz mogą być oparte na zupełnie nowych danych.
Na przykład szkolony modelu przypadek zestaw danych, zawierający 1 000 wierszy.You then add 100 rows of new data.Analysis Services drops the first 100 rows from the training set and adds the 100 rows of new data to the end of the set for a total of 1000 rows.Jeśli dodajesz wiersze 1100 nowych danych, używane są tylko ostatnich wierszy 1000.
Oto przykład innego.Dodać trzy nowe miesiąca dla wartości danych i utworzyć trzy nowe prognoz, może wykonać następujące czynności:
Utwórz PREDICTION JOIN Czas modelu serii i stosowania REPLACE_MODEL_CASE argument.
Określ urządzenie źródłowe trzech miesięcy nowych danych.Może to być urządzenie źródłowe zupełnie inaczej niż oryginalne dane szkolenia.
Żądanie prognoz dla sześciu wycinki czas.W tym celu należy określić 6 wycinki czas lub określić punkt początkowy jako przedział czas 1, a punkt końcowy jako przedział czas 7.
Uwaga
W odróżnieniu od EXTEND_MODEL_CASES, nie będzie można przywrócić te same wartości, które są dodawane jako danych wejściowych. Wszystkie sześć wartości zwracane są prognoz opartych na modelu zaktualizowany, który zawiera zarówno stare i nowe dane.
Uwaga
Z REPLACE_MODEL_CASES, począwszy od sygnatury czasowej 1 zostanie wyświetlony nowy prognoz na podstawie nowych danych, które zastępuje stare dane szkolenia.
Przykładowe kwerendy i dowiedzieć się więcej na temat składni przy użyciu REPLACE_MODEL_CASES i EXTEND_MODEL_CASES, zobacz PredictTimeSeries (DMX).
Powrót do początku
Praca z brakujących wartości.
Podczas dodawania nowych danych do modelu serii czas przy użyciu PREDICTION JOIN instrukcja, nowy zestaw danych nie może mieć żadnych brakujących wartości. Jeśli ciągu jest niekompletna, model musi dostarczyć brakujące wartości za pomocą wartość null, oznacza numeryczne, określonej średniej numerycznych lub przewidywane wartości.Jeśli określisz EXTEND_MODEL_CASES, Analysis Services Zamienia brakujące wartości prognoz na podstawie oryginalnego modelu. Jeśli używasz REPLACE_MODEL_CASES, Analysis Services brakujące wartości są zamieniane wartości określonej w MISSING_VALUE_SUBSTITUTION parametr.
Powrót do początku
Lista przewidywanie funkcje
Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Jednak Microsoft Algorytm seria czas obsługuje dodatkowe funkcje wymienione w poniższej tabela.
Zwraca liczbę wycinków czas między data bieżącą przypadek i ostatnią data zestaw szkoleniowy. Typowym zastosowaniem tej funkcja jest zidentyfikowanie ostatnich przypadkach szkolenia, dzięki czemu można pobierać dane szczegółowe informacje dotyczące spraw. |
|
Zwraca identyfikator węzła dla określonego przewidywalna kolumna. Typowym zastosowaniem tej funkcja jest do identyfikacji węzła, który generowanych na konkretną wartość przewidywane, dzięki czemu można przeglądać sprawy związane z węzła, równania i inne szczegóły. |
|
Zwraca odchylenie standardowe prognoz w określonym przewidywalna kolumna. Ta funkcja zastępuje argument INCLUDE_STATISTICS, który nie jest obsługiwany w przypadku modeli serii czas. |
|
Zwraca wariancję prognoz dla określonej kolumna przewidywalne. Ta funkcja zastępuje argument INCLUDE_STATISTICS, który nie jest obsługiwany w przypadku modeli serii czas. |
|
Zwraca przewidywane historycznych lub przyszłych wartości czas serii danych. Również kwerendy można modeli serii czas za pomocą funkcja przewidywanie ogólne Przewidywanie (DMX). |
Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji do kwerendy typy (DMX). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).
See Also