Podczas badania logistyczne regresja modelu (Analysis Services — wyszukiwanie danych)
Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie, która używa desenie w modelu, aby prognoz za pomocą nowych danych.
W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na algorytmie Regresja logistyczne firmy Microsoft.
Kwerendy zawartości
Trwa pobieranie parametrów modelu przy użyciu zestaw zestaw wierszy schematu wyszukiwanie danych
Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX
Kwerendy przewidywanie
Tworzenie prognoz dla wartości stałe
Tworzenie prognoz dla discrete wartości
Kwerendy zawartości na modelu regresja logistyczne
Modele logistyczne regresja są tworzone przy użyciu specjalnego zestaw parametrów algorytmu neuronowe sieci firmy Microsoft; dlatego modelu regresja logistyczne zawiera niektóre z tych samych informacji jako model neuronowe sieci, ale jest mniej skomplikowana.Aby zrozumieć strukturę zawartości modelu oraz typy węzłów, które są przechowywane jaki rodzaj informacji, zobacz model wyszukiwania Zawartości dla logistyczne modele regresji (Analysis Services — wyszukiwanie danych).
Aby utworzyć model wyszukiwania, który jest używany w następujących scenariuszach kwerendy, wykonaj kroki opisane w poniższej sekcji pośrednich samouczek wyszukiwanie danych, które w tym artykule wyjaśniono, jak używać neuronowe sieci i modele logistyczne regresja.
Lekcja 542c3701a-1fd2-44ff-b7de-377345bbbd6b
Struktura wyszukiwania, docelowa wysyłkowe, można użyć z Podstawowe wyszukiwanie danych — samouczek.
Przykładowa kwerenda 1: Trwa pobieranie parametrów modelu przy użyciu zestaw zestaw wierszy schematu wyszukiwanie danych
Za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak jego utworzenia, podczas ostatniego przetworzenia modelu, nazwa struktura wyszukiwania na podstawie modelu i nazwę kolumna, używane jako atrybut przewidywalne.W poniższym przykładzie zwraca parametry, które były używane, gdy najpierw została utworzona w modelu, łącznie z nazwą i typ modelu, oraz dzień, w którym został utworzony.
SELECT MODEL_NAME, SERVICE_NAME, DATE_CREATED, MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center_LR'
Przykładowe wyniki:
NAZWA_MODELU |
NAZWA_USŁUGI |
DATE_CREATED |
MINING_PARAMETERS |
|---|---|---|---|
Wywołanie Center_LR |
Microsoft_Logistic_Regression |
04/07/2009 20:38:33 |
HOLDOUT_PERCENTAGE = 30 HOLDOUT_SEED = 1, MAXIMUM_INPUT_ATTRIBUTES = 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255 MAXIMUM_STATES = 100 SAMPLE_SIZE = 10 000 |
Powrót do początku
Przykładowa kwerenda 2: Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX
Następująca kwerenda zwraca niektóre podstawowe informacje o modelu regresja logistyczne.Ten model został utworzony za pomocą dwóch przewidywalne atrybuty, które można wyodrębnić z zawartością modelu za pomocą następującej kwerendy.Należy pamiętać, że model logistyczne regresja jest podobny do modelu neuronowe sieci na wiele sposobów, włączając w to obecność węzeł Statystyka marginalna (NODE_TYPE = 24), zawiera opis wartości używanych jako danych wejściowych.W związku z tym pobierając je z tabela zagnieżdżonej NODE_DISTRIBUTION można znaleźć wartości wszystkie możliwe dane wejściowe.
SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM [TM_Logistic Regression].CONTENT
Częściowe wyniki:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.SUPPORT |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
|---|---|---|---|---|---|
Okres ważności |
Brak |
0 |
0 |
0 |
1 |
Okres ważności |
45.43491192 |
17484 |
1 |
126.9544114 |
3 |
Rower kupujących |
Brak |
0 |
0 |
0 |
1 |
Rower kupujących |
0 |
8869 |
0.507263784 |
0 |
4 |
Rower kupujących |
1 |
8615 |
0.492736216 |
0 |
4 |
Commute odległość |
Brak |
0 |
0 |
0 |
1 |
Commute odległość |
Mile 5-10 |
3033 |
0.173472889 |
0 |
4 |
Rzeczywiste kwerenda zwraca dużo więcej wierszy, jednak w tym przykładzie zestawiono typy dostarczonych informacji o danych wejściowych.Na przykład w związku z ciągłą dane wejściowe są discretized każda możliwa wartość discrete wartość znajduje się w tabela.Aby uzyskać więcej informacji na temat korzystania z informacji w węźle marginalna statystyki zobacz model wyszukiwania Zawartości dla logistyczne modele regresji (Analysis Services — wyszukiwanie danych).
Uwaga
Wyniki mają zostać spłaszczone dla ich łatwiejszego oglądania, ale można je zwrócić tabela zagnieżdżona w jednej kolumnie, gdy użytkownik dostawca obsługuje hierarchicznych zestawów wierszy.Aby uzyskać więcej informacji zobacz Hierarchiczne zestawy wierszy OLE DB Programmer's Guide.
Powrót do początku
Kwerendy przewidywanie na modelu regresja logistyczne
Można użyć Przewidywanie (DMX) Funkcja z wszelkiego rodzaju model wyszukiwania, aby podać nowe dane i tworzenie prognoz. Funkcje służą także do zwraca dodatkowe informacje dotyczące prognozowania, takie jak prawdopodobieństwo, że przewidywanie jest poprawna.W tej części podano kilka przykładowych kwerend przewidywanie na modelu regresja logistyczne.
Przykładowa kwerenda 3: Tworzenie prognoz dla miejscach, gdzie wartość
Ponieważ logistyczne regresja obsługuje korzystanie z ciągłą atrybutów dla obu danych wejściowych i przewidywanie, można łatwo tworzyć modele, które skorelować różnych czynników, w danych.Za pomocą kwerendy przewidywanie przeszukiwać relację między tymi.
Następująca kwerenda jest pojedyncza kwerendę prognozuje jakości usługa dla przesunięcia w piątek AM.The PredictHistogram (DMX) funkcja returns a nested tabela that provides statistics relevant to understanding the validity of the predicted value.
SELECT
Predict([Call Center_LR].[Service Grade]) as Predicted ServiceGrade,
PredictHistogram([Call Center_LR].[Service Grade]) as [Results],
FROM
[Call Center_LR]
NATURAL PREDICTION JOIN
(SELECT 'Friday' AS [Day Of Week],
'AM' AS [Shift]) AS t
Przykładowe wyniki:
Przewidywane kategorii usługa |
Wyniki |
|---|---|
0.102601830123659 |
Usługa klasyOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ ADJUSTEDPROBABILITYODCHYLENIE $$ ODCH.STANDARDOWE
0.10260183012365983.02325581395350.98837209302325600.001205526606000870.034720694203902
0.9767441860465120.01162790697674420.011627906976744200
|
Aby uzyskać więcej informacji na temat tego rozkładu, obsługa i odchylenie standardowe wartości w tabela zagnieżdżonej NODE_DISTRIBUTION zobacz model wyszukiwania Zawartości dla logistyczne modele regresji (Analysis Services — wyszukiwanie danych).
Powrót do początku
Przykładowa kwerenda 4: Tworzenie prognoz dla discrete wartość
Logistyczne regresja jest zazwyczaj używany w scenariuszach miejsce, w które chcesz analizować czynników, które przyczyniają się do wyniku binarne.Mimo że oryginalny model używany w samouczku przewidywane wartości ciągły, w scenariuszu życia rzeczywistym zachodzi potrzeba zestaw up modelu, więc tej klasy usługa spełnione pewne wartości miejsce docelowe i nie może spełnić tego paska.Można również grupować przewidywanych wyników do Dobra, Uczciwej, or Niska.Aby zmienić sposób zgrupowanych atrybut przewidywalny, utworzyć kopię struktura wyszukiwania, a następnie zmień metoda discretization.Poniższa procedura opisuje sposób zmiany grupowanie wartości usługa kategorii w danych Centrum wywołania.
Aby utworzyć discretized wersja struktura wyszukiwania Centrum wywołań i modele
W Business Intelligence Development Studio w programie eksplorator rozwiązań rozwiń Struktury wyszukiwania.
Kliknij prawym przyciskiem myszy Center.dmm wywołań i wybierz polecenie Kopia.
Kliknij prawym przyciskiem myszy Struktury wyszukiwania i wybierz opcję Wklej.Dodane nowe iss struktura wyszukiwania, nazwany wywołań 1 Centrum.
Kliknij prawym przyciskiem myszy nową struktura wyszukiwania i wybierz polecenie Zmienianie nazwy.Wpisz nową nazwę Centrum wywołanie Discretized.
Kliknij dwukrotnie nowej struktura wyszukiwania, aby go otworzyć w konstruktorze.Należy zauważyć, że modeli wyszukiwania zostały wszystkie skopiowane także i wszystkie mają rozszerzenie 1.Pozostaw nazwy jest teraz.
W Struktura wyszukiwania kartę, kliknij prawym przyciskiem myszy kolumna usługa kategorii, a następnie wybierz Właściwości.
Zmiana Content Właściwość z Ciągłe to Discretized.Zmiana DiscretizationMethod Właściwość Klastry.Wpisz BucketCount Discretization 3.
Uwaga
Te parametry tylko są używane ilustrujących proces i nie daje musi być prawidłowy model
Z model wyszukiwania Wybierz opcję menuStruktura procesu i wszystkie modele.
W następującej kwerendzie przykładowej opiera się na tym modelu discretized i przewiduje jakości usług na dany dzień tygodnia, wraz z nimi prawdopodobieństwa dla każdego przewidywanego wyniku.
SELECT
(PredictHistogram([Call Center_LR 1].[Service Grade])) as [Predictions]
FROM
[Call Center_LR 1]
NATURAL PREDICTION JOIN
(SELECT 'Saturday' AS [Day Of Week]) AS t
Oczekiwane wyniki:
Prognoz |
|---|
Usługa klasyOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ ADJUSTEDPROBABILITYODCHYLENIE $$ ODCH.STANDARDOWE
0.1087271838312535.72465047706410.4252934580602870.017016836003029300
0.0585576923062531.70988808007030.3774986676198850.02088202006045400
0.17016949152515.61091598832020.1858442379561920.066138657138604900
0.9545454545454550.01136363636363640.011363636363636400
|
Uwaga Aby przewidywalne wyniki zostały zgrupowane w trzech kategoriach określonych; jednak te grupy są oparte na klastrowanie rzeczywistych wartości w danych, a nie dowolny wartości, które zestaw jako cele biznesowe.
Powrót do początku
Lista przewidywanie funkcje
Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Jednak Microsoft Algorytm Regresja logistyczne obsługuje dodatkowe funkcje wymienione w poniższej tabela.
|
Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji do kwerendy typy (DMX). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).
Uwaga
Neuronowe sieci i modele logistyczne regresja PredictSupport (DMX) funkcja zwraca jedną wartość, która reprezentuje rozmiar szkolenia zestaw dla całego modelu.
Historia zmian
Microsoft Learning |
|---|
Zmienić przykłady używania modelu regresja logistyczne z samouczka wyszukiwanie danych pośrednich. |
Procedura dodanych w tym artykule opisano sposób tworzenia discretized kopię istniejącego modelu regresja logistyczne. |
Dodano łącza w temacie ułatwiają poruszanie się między przykładowe kwerendy. |
See Also