Tworzenie struktury sieci neuronowe i modelu (zaawansowany samouczek wyszukiwanie danych)
Do tworzenia modeli wyszukiwanie danych, należy najpierw użyć Kreatora wyszukiwanie danych do utworzenia nowej struktura wyszukiwania oparte na nowym widok urządzenie źródłowe danych.W tym zadaniu można użyć kreatora do utworzenia struktura wyszukiwania, a jednocześnie utworzyć model skojarzony wyszukiwania na podstawie Microsoft Algorytm neuronowe sieci.
Ponieważ sieci neuronowe są bardzo elastyczne i można analizować wiele kombinacji danych wejściowych i wyjściowych, należy wypróbować kilka sposobów przetwarzania danych, aby uzyskać najlepsze wyniki.Na przykład można dostosować sposób, w której dane binned, lub zgrupowane, aby miejsce docelowe wymagań firmy.Aby to zrobić, można będzie dodać nową kolumna do struktura wyszukiwania grup danych liczbowych w inny sposób, a następnie utwórz model, który korzysta z nowej kolumna.Za pomocą tych modeli wyszukiwania będzie wykonać niektóre poszukiwań.
Oddzielny model prognozowania i tworzenia wyników zbudować na koniec, kiedy wiadomości mają z modelu sieci neuronowe czynników, które mają największy wpływ na Twoje pytanie biznesowe.Używane Microsoft Logistyczne Regresja algorytmu, który jest oparty na modelu neuronowe sieci, ale jest zoptymalizowany do znalezienia rozwiązania oparte na konkretnych danych wejściowych.
Tworzenie struktury Centrum połączenie domyślne
Aby utworzyć sieć neuronowe domyślna struktura wyszukiwania i modelu
W programie eksplorator rozwiązań, w polu Business Intelligence Development Studio, kliknij prawym przyciskiem myszy Struktury wyszukiwania i wybierz opcję Nowa struktura wyszukiwania.
Na Zapraszamy do Kreatora wyszukiwanie danych strona, kliknij przycisk Następny.
Na Wybierz metoda definicji strona, sprawdź, że Z istniejącego magazynu relacyjnej bazy danych lub danych jest zaznaczone, a następnie kliknij przycisk Następny.
Na Tworzenie struktury danych wyszukiwania strona, sprawdź, czy opcja Tworzenie struktura wyszukiwania z model wyszukiwania jest zaznaczone.
Kliknij listę rozwijaną dla opcji Które techniką wyszukiwanie danych chcesz użyć?, a następnie wybierz opcję Microsoft neuronowe sieci.
Ponieważ modeli logistyczne regresja są oparte na sieci neuronowe, można użyć ponownie tę samą strukturę i dodać nowy model wyszukiwania.
Kliknij przycisk Następny.
The Select Data urządzenie źródłowe View strona appears.
W obszarze Widoki urządzenie źródłowe danych dostępne, select Centrum wywołania, a następnie kliknij przycisk Następny.
Na Określanie typów tabel strona, zaznacz przypadek pole obok FactCallCenter tabela.Kliknij przycisk Następny.
Na Określ dane szkolenia Wybierz opcję stronieKlucz obok kolumna FactCallCenterID.
Wybierz Przewidywanie and Dane wejściowe pola wyboru.
Wybierz Klucz, Dane wejściowe, and Przewidywaniepola wyboru jak to pokazano w poniższej tabela:
Tabele/kolumny
Klucz/wprowadzania/prognozowania
AutomaticResponses
Dane wejściowe
AverageTimePerIssue
Dane wejściowe/prognozowania
Wywołania
Dane wejściowe
DateKey
Nie należy używać
DayOfWeek
Dane wejściowe
FactCallCenterID
Klucz
IssuesRaised
Dane wejściowe
LevelOneOperators
Dane wejściowe/prognozowania
LevelTwoOperators
Dane wejściowe
Zamówienia
Dane wejściowe/prognozowania
ServiceGrade
Dane wejściowe/prognozowania
SHIFT
Dane wejściowe
TotalOperators
Nie należy używać
WageType
Dane wejściowe
Na Określ zawartość i typ danych kolumny strona, upewnij się, że w siatce zawiera kolumny, typy zawartości i typy danych, jak pokazano w poniższej tabela, a następnie kliknij przycisk Następny.
Kolumny
ALT + F3, B
Typy danych
AutomaticResponses
Ciągłe
Długie
AverageTimePerIssue
Ciągłe
Długie
Wywołania
Ciągłe
Długie
DayOfWeek
Discrete
Tekstowe
FactCallCenterID
Klucz
Długie
IssuesRaised
Ciągłe
Długie
LevelOneOperators
Ciągłe
Długie
LevelTwoOperators
Ciągłe
Długie
Zamówienia
Ciągłe
Długie
ServiceGrade
Ciągłe
Double
SHIFT
Discrete
Tekstowe
WageType
Discrete
Tekstowe
Na Tworzenie zestaw testów strona, wyczyść tekst pole opcji Udział procentowy danych do testowania.Kliknij przycisk Następny.
Na Kończenie pracy Kreatora Strona Nazwa struktura wyszukiwania, type Centrum wywołania.
Dla Nazwa model wyszukiwania, type Domyślne Centrum wywołanie NN, a następnie kliknij przycisk Zakończenie.
The Allow drill through box is disabled because you cannot drill through to data with neural network models.
W programie eksplorator rozwiązań, kliknij prawym przyciskiem myszy nazwę danych struktura wyszukiwania, które właśnie utworzone, a następnie wybierz pozycję Proces.
Opis Discretization
Domyślnie podczas tworzenia modelu neuronowe sieci, który ma atrybut numeryczny przewidywalne algorytm Microsoft Network neuronowe traktuje jako ciągły numer atrybutu.Na przykład atrybut ServiceGrade jest liczbą, która teoretycznie dla zakresu od 0,00 (odpowiedzieć na wszystkie wywołania) 1.00 (wszystkie obiekty wywołujące Rozłącz).W tym zestawie danych wartości mają następujące dystrybucji:
.gif)
W rezultacie podczas przetwarzania modelu dane wyjściowe mogą być pogrupowane inaczej niż można by oczekiwać.Na przykład domyślny model, który używa klastrowanie, aby znaleźć grupy wartości, dzieli ServiceGrade na zakresach, takie jak to: 0.0748051948 - 0.09716216215.Mimo że ta grupowanie jest matematycznie dokładne, takie zakresy może nie być tak istotnych dla użytkowników biznesowych.Inny sposób grupowania wartości liczbowe, można utworzyć jego kopię lub wielu kopii kolumna danych numerycznych i określić, jak algorytmu wyszukiwanie danych ma być przetwarzana wartości.Na przykład można określić, że algorytm podzielić wartości nie więcej niż pięć pojemników.
Usługi Analysis Services oferuje różne metody binning lub przetwarzania danych liczbowych.W poniższej tabela pokazano różnice między wyniki, gdy atrybut danych wyjściowych ServiceGrade zostało przetworzone trzy różne sposoby:
Traktując ją jako liczbę ciągłe
O algorytm dyskretyzować wartości przez najlepszą możliwą metoda, co się dzieje z się klastrowanie
Określanie, że numery można binned metodą równe obszary
Domyślny model (ciągłe) |
Binned przez klastrowanie |
Binned według obszarów równe |
|---|---|---|
VALUEPOMOC TECHNICZNA
Brak0
0.09875120
|
VALUEPOMOC TECHNICZNA
< 0.074805194834
0.0748051948 - 0.0971621621527
0.09716216215 - 0.1329729729539
0.13297297295 - 0.16749999997510
>= 0.16749999997510
|
VALUEPOMOC TECHNICZNA
< 0.0726
0.07 - 0.0022
0.09 - 0.1136
>= 0.1236
|
W tej tabela kolumnie wartości pokazuje, w jaki sposób zaksięgowania ciągły numer, a kolumna SUPPORT pokazuje, ile wierszy znaleziono o tę wartość, zakres lub wartości typu.Aby uzyskać więcej informacji na temat opcji binning zobacz Metody discretization (wyszukiwanie danych).
Uwaga
Te statystyki z węzła marginalna statystyki modelu, można uzyskać po wszystkich danych została przetworzona.Aby uzyskać więcej informacji na temat węzła marginalna statystyk Zobacz model wyszukiwania Zawartości dla neuronowe modele sieci (Analysis Services — wyszukiwanie danych).
Alternatywnie zamiast używać wartości liczbowych, można dodać osobne kolumna pochodna, takie jak klasyfikuje klas usługa w zakresach docelowym wstępnie zdefiniowanych Najlepsze (ServiceGrade < = 0.05), Dopuszczalne (0,10 > ServiceGrade > 0,05), a Niska (ServiceGrade > = 0,10).
Tworząc kopię kolumna i zmienić metoda Discretization
W polu wyszukiwanie danych usług Analysis Services, można łatwo zmienić sposób, w jaki dane liczbowe są binned w ramach struktura wyszukiwania przez dodanie kolumna zawierające dane domiejsce doceloweowej i zmienić metoda discretization kopii.
Poniższa procedura opisuje sposób utworzyć kopię kolumna wyszukiwania, która zawiera atrybut miejsce docelowe ServiceGrade.Można utworzyć wiele kopii każdej kolumna struktura wyszukiwania, tym przewidywalne atrybut.
Następnie będzie można dostosować grupowanie wartości liczbowych kolumna skopiowany, należy zmniejszyć złożoność grupowania.Ten samouczek będzie należy użyć metoda discretization równe obszary i określić cztery pakiety.Grupowanie, wynikające z tej metoda są dość blisko wartości miejsce docelowe, przydatne dla użytkowników biznesowych.
Uwaga
Podczas wstępnego eksploracji danych można również eksperymentować z różnymi metodami discretization lub spróbuj najpierw klastrowanie danych.
Aby utworzyć kopię dostosowane kolumna w strukturze wyszukiwania
W programie eksplorator rozwiązań kliknij dwukrotnie struktura wyszukiwania, która właśnie została utworzona.
Na karcie struktura wyszukiwania kliknij przycisk Dodawanie kolumna struktury wyszukiwania.
W Zaznacz kolumnę okno dialogowe ServiceGrade wybierz z listy w Kolumna źródłowa, następnie kliknij przycisk OK.
Nowa kolumna jest dodawany do listy kolumn struktura wyszukiwania.Domyślnie nowe kolumna wyszukiwania ma taką samą nazwę jak istniejącą kolumna, za pomocą przyrostkowo numeryczny: na przykład ServiceGrade 1. Można zmienić nazwę kolumna, to być bardziej opisową.
Można także określić metoda discretization.
Kliknij prawym przyciskiem myszy ServiceGrade 1 i wybierz polecenie Właściwości.
W Właściwości okno ZnajdźNazwa właściwość i zmiany nazwy na Wywołanie Centrum Binned NN.
Okno dialogowe pojawi się monit, czy konieczne jest wprowadzenie zmian w tej samej nazwy wszystkich powiązanych model wyszukiwania kolumn.Kliknij przycisk Nr.
W Właściwości oknie zlokalizować sekcji Typ danych i w razie potrzeby je rozwinąć.
Zmień wartość właściwość Content z Continuous Aby Discretized.
Dostępne są następujące właściwości.Zmienić wartości właściwości, jak pokazano w poniższej tabela:
Właściwość
Wartość domyślna
Nowa wartość
DiscretizationMethod
Continuous
EqualAreas
DiscretizationBucketCount
Wartość nie
4
Uwaga
Wartość domyślna DiscretizationBucketCount() faktycznie jest 0, co oznacza, że algorytm automatycznie określa optymalną liczba przedziałów. Dlatego jeśli chcesz przywrócić jego domyślną wartość tej właściwość, wpisz 0.
W Konstruktorze wyszukiwanie danych, kliknij przycisk Modele wyszukiwania tab.
Zauważyć, że po dodaniu kopię struktura wyszukiwania kolumna, Flaga użycie kopii automatycznie jest ustawiona na Ignore. Zazwyczaj podczas kopiowania kolumna zostanie dodana do struktura wyszukiwania, do analizy wraz z oryginalnym kolumna nie może użyć kopii lub algorytm znajdują się mocne korelacji między dwoma kolumnami, które mogą zasłaniać inne relacje.
Dodawanie nowego model wyszukiwania struktura wyszukiwania
Teraz, gdy utworzono nowe grupowanie dla atrybut lokalizacji miejsce docelowe, należy dodać nowy model wyszukiwania używającej kolumna wartości dyskretnych.Gdy skończysz, the CallCenter struktura wyszukiwania będzie miał dwa modele wyszukiwania:
Model wyszukiwania, wywołanie Centrum domyślne NN, obsługi wartości ServiceGrade jako ciągłego zakres.
Model wyszukiwania, wywołanie Centrum Binned NN, discretizes wartości ServiceGrade na cztery różne pakiety.
Aby dodać model wyszukiwania, oparty na nowej kolumna discretized
W programie eksplorator rozwiązań kliknij prawym przyciskiem myszy właśnie utworzone, i wybierz opcję Struktura wyszukiwania Otwórz.
Kliknij przycisk Modele wyszukiwania tab.
Kliknij przycisk Utwórz pokrewnych model wyszukiwania.
W Nowy model wyszukiwania okno dialogowe, aby Nazwa modelu, type Wywołanie Centrum Binned NN.W Nazwa algorytmu rozwijaną listę, wybierz opcję Microsoft Network neuronowe.
Na liście kolumn zawartych w nowym model wyszukiwania zlokalizuj ServiceGrade i zmienić korzystaniu z Predict Aby Ignore.
Podobnie zlokalizuj Binned ServiceGrade i zmienić korzystaniu z Ignore Aby Predict.
Zazwyczaj użytkownik nie może porównać modeli wyszukiwania, używających różnych przewidywalne atrybutów.Jednak w SQL Server 2008, można utworzyć alias dla kolumna model wyszukiwania. Oznacza to aby miała taką samą nazwę jak oryginalne kolumna można zmienić nazwę kolumna Binned ServiceGrade wewnątrz model wyszukiwania.Następnie bezpośrednio porównanie tych dwóch modeli na wykresie dokładności nawet wtedy, gdy dane są inaczej discretized.
Aby dodać alias a struktura wyszukiwania kolumn w model wyszukiwania
W Modele wyszukiwania karcie w obszarzeStruktura, wybierz opcję Binned ServiceGrade.
Należy zauważyć, że Właściwości okna są wyświetlane właściwości obiektu ScalarMiningStructure kolumna.
kolumna dla model wyszukiwania, Binned ServiceGrade NN, kliknij komórka odpowiadającą kolumnie Binned ServiceGrade.
Uwaga ta teraz Właściwości okno wyświetla właściwości dla obiektu MiningModelColumn.
Zlokalizuj Nazwa właściwość i zmień wartość ServiceGrade.
Zlokalizuj Opis właściwość i wpisz Alias tymczasową kolumna.
The Properties window should contain the following information:
Właściwość
Wartość
Description
Alias tymczasową kolumna
Identyfikator
ServiceGrade Binned
Modelowanie flagi
Imię i nazwisko
Usługa klasy
Identyfikator elementu SourceColumn
Usługa klasy 1
Sposób użycia
Przewidywanie
Kliknij w dowolnym miejscu model wyszukiwania tab.
Siatka zostanie zaktualizowana tak, aby wyświetlić nowy alias tymczasową kolumna, ServiceGrade, obok użycia kolumna.Siatka zawierające struktura wyszukiwania i dwóch modeli wyszukiwania powinien wyglądać następująco:
Struktura
Domyślne Centrum wywołanie NN
Wywołanie Centrum Binned NN
Microsoft Network neuronowe
Microsoft Network neuronowe
AutomaticResponses
Dane wejściowe
Dane wejściowe
AverageTimePerIssue
Przewidywanie
Przewidywanie
Wywołania
Dane wejściowe
Dane wejściowe
DayOfWeek
Dane wejściowe
Dane wejściowe
FactCallCenterID
Klucz
Klucz
IssuesRaised
Dane wejściowe
Dane wejściowe
LevelOneOperators
Dane wejściowe
Dane wejściowe
LevelTwoOperators
Dane wejściowe
Dane wejściowe
Zamówienia
Dane wejściowe
Dane wejściowe
ServceGrade Binned
Ignoruj
Przewidywanie (ServiceGrade)
ServiceGrade
Przewidywanie
Ignoruj
SHIFT
Dane wejściowe
Dane wejściowe
Operatorzy całkowita
Dane wejściowe
Dane wejściowe
WageType
Dane wejściowe
Dane wejściowe
Przetwarzanie modelu
Na koniec, w celu zapewnienia, że zostały utworzone modele są porównywalne, który będzie zestaw parametr siewnego domyślne i binned modeli.Ustawianie wartość początkową gwarancji, że rozpoczyna się każdy model przetwarzania danych z tego samego punktu.
Uwaga
Jeśli wartość liczbową parametru siewnego nie zostanie określony, program SQL Server Analysis Services wygeneruje siewnego, na podstawie nazwy modelu.Ponieważ model neuronowe sieci i modelu regresja logistyczne nazywają się inaczej, musisz zestaw wartość początkową, aby zapewnić, że przetwarzania danych w tej samej kolejności.
Aby określić siewnego i przetworzyć modele
W Model górnictwie kartę, kliknij prawym przyciskiem myszy kolumna o nazwie Centrum Call - LR, modelu i wybierz Ustawianie parametrów algorytmu.
W wierszu dla parametru HOLDOUT_SEED kliknij puste komórka w obszarze Wartość, and type 1.Kliknij przycisk OK.Powtórz ten krok dla każdego modelu związane ze strukturą.
Uwaga
Wartość, która zostanie wybrana opcja jako siewnego nie ma znaczenia, jeśli w używanej siewnego takie same dla wszystkich powiązanych modeli.
W Modele wyszukiwania Wybierz opcję menuProces struktura wyszukiwania i wszystkie modele.Kliknij przycisk Tak wdrożyć projektu górnictwo zaktualizowane dane na serwerze.
W Proces model wyszukiwania okno dialogowe kliknijUruchamianie.
Kliknij przycisk Zamknij zamknięciaPostęp procesu okna dialogowego, a następnie kliknij przycisk ZamknijProces model wyszukiwania -okno dialogowe.
Teraz, gdy utworzono dwa modele powiązanych wyszukiwania będzie zapoznaj się dane, aby odkryć relacje w danych.
Keyboard Shortcuts in Reporting Services
Poznawanie Centrum wywołania modelu (samouczek wyszukiwanie danych pośrednich)
Historia zmian
Microsoft Learning |
|---|
Samouczek scenariusz zaktualizowane do używania jednego struktura wyszukiwania zawiera wiele kopii kolumna numerycznej z każdej z kolumn discretized w różny sposób. |
Dodaje objaśnienia sposobów korzystania z modeli wyszukiwanie danych, aliasy kolumna |
Poprawiono nazwy model wyszukiwania w prognoz i instrukcje DDL uwzględnienie zaktualizowanych scenariusza. |
Dodaje typy danych poszczególnych typów zawartości dla nowej kolumna DayOfWeek. |