Udostępnij przez


Tworzenie struktury sieci neuronowe i modelu (zaawansowany samouczek wyszukiwanie danych)

Do tworzenia modeli wyszukiwanie danych, należy najpierw użyć Kreatora wyszukiwanie danych do utworzenia nowej struktura wyszukiwania oparte na nowym widok urządzenie źródłowe danych.W tym zadaniu można użyć kreatora do utworzenia struktura wyszukiwania, a jednocześnie utworzyć model skojarzony wyszukiwania na podstawie Microsoft Algorytm neuronowe sieci.

Ponieważ sieci neuronowe są bardzo elastyczne i można analizować wiele kombinacji danych wejściowych i wyjściowych, należy wypróbować kilka sposobów przetwarzania danych, aby uzyskać najlepsze wyniki.Na przykład można dostosować sposób, w której dane binned, lub zgrupowane, aby miejsce docelowe wymagań firmy.Aby to zrobić, można będzie dodać nową kolumna do struktura wyszukiwania grup danych liczbowych w inny sposób, a następnie utwórz model, który korzysta z nowej kolumna.Za pomocą tych modeli wyszukiwania będzie wykonać niektóre poszukiwań.

Oddzielny model prognozowania i tworzenia wyników zbudować na koniec, kiedy wiadomości mają z modelu sieci neuronowe czynników, które mają największy wpływ na Twoje pytanie biznesowe.Używane Microsoft Logistyczne Regresja algorytmu, który jest oparty na modelu neuronowe sieci, ale jest zoptymalizowany do znalezienia rozwiązania oparte na konkretnych danych wejściowych.

Tworzenie struktury Centrum połączenie domyślne

Aby utworzyć sieć neuronowe domyślna struktura wyszukiwania i modelu

  1. W programie eksplorator rozwiązań, w polu Business Intelligence Development Studio, kliknij prawym przyciskiem myszy Struktury wyszukiwania i wybierz opcję Nowa struktura wyszukiwania.

  2. Na Zapraszamy do Kreatora wyszukiwanie danych strona, kliknij przycisk Następny.

  3. Na Wybierz metoda definicji strona, sprawdź, że Z istniejącego magazynu relacyjnej bazy danych lub danych jest zaznaczone, a następnie kliknij przycisk Następny.

  4. Na Tworzenie struktury danych wyszukiwania strona, sprawdź, czy opcja Tworzenie struktura wyszukiwania z model wyszukiwania jest zaznaczone.

  5. Kliknij listę rozwijaną dla opcji Które techniką wyszukiwanie danych chcesz użyć?, a następnie wybierz opcję Microsoft neuronowe sieci.

    Ponieważ modeli logistyczne regresja są oparte na sieci neuronowe, można użyć ponownie tę samą strukturę i dodać nowy model wyszukiwania.

  6. Kliknij przycisk Następny.

    The Select Data urządzenie źródłowe View strona appears.

  7. W obszarze Widoki urządzenie źródłowe danych dostępne, select Centrum wywołania, a następnie kliknij przycisk Następny.

  8. Na Określanie typów tabel strona, zaznacz przypadek pole obok FactCallCenter tabela.Kliknij przycisk Następny.

  9. Na Określ dane szkolenia Wybierz opcję stronieKlucz obok kolumna FactCallCenterID.

  10. Wybierz Przewidywanie and Dane wejściowe pola wyboru.

  11. Wybierz Klucz, Dane wejściowe, and Przewidywaniepola wyboru jak to pokazano w poniższej tabela:

    Tabele/kolumny

    Klucz/wprowadzania/prognozowania

    AutomaticResponses

    Dane wejściowe

    AverageTimePerIssue

    Dane wejściowe/prognozowania

    Wywołania

    Dane wejściowe

    DateKey

    Nie należy używać

    DayOfWeek

    Dane wejściowe

    FactCallCenterID

    Klucz

    IssuesRaised

    Dane wejściowe

    LevelOneOperators

    Dane wejściowe/prognozowania

    LevelTwoOperators

    Dane wejściowe

    Zamówienia

    Dane wejściowe/prognozowania

    ServiceGrade

    Dane wejściowe/prognozowania

    SHIFT

    Dane wejściowe

    TotalOperators

    Nie należy używać

    WageType

    Dane wejściowe

  12. Na Określ zawartość i typ danych kolumny strona, upewnij się, że w siatce zawiera kolumny, typy zawartości i typy danych, jak pokazano w poniższej tabela, a następnie kliknij przycisk Następny.

    Kolumny

    ALT + F3, B

    Typy danych

    AutomaticResponses

    Ciągłe

    Długie

    AverageTimePerIssue

    Ciągłe

    Długie

    Wywołania

    Ciągłe

    Długie

    DayOfWeek

    Discrete

    Tekstowe

    FactCallCenterID

    Klucz

    Długie

    IssuesRaised

    Ciągłe

    Długie

    LevelOneOperators

    Ciągłe

    Długie

    LevelTwoOperators

    Ciągłe

    Długie

    Zamówienia

    Ciągłe

    Długie

    ServiceGrade

    Ciągłe

    Double

    SHIFT

    Discrete

    Tekstowe

    WageType

    Discrete

    Tekstowe

  13. Na Tworzenie zestaw testów strona, wyczyść tekst pole opcji Udział procentowy danych do testowania.Kliknij przycisk Następny.

  14. Na Kończenie pracy Kreatora Strona Nazwa struktura wyszukiwania, type Centrum wywołania.

  15. Dla Nazwa model wyszukiwania, type Domyślne Centrum wywołanie NN, a następnie kliknij przycisk Zakończenie.

    The Allow drill through box is disabled because you cannot drill through to data with neural network models.

  16. W programie eksplorator rozwiązań, kliknij prawym przyciskiem myszy nazwę danych struktura wyszukiwania, które właśnie utworzone, a następnie wybierz pozycję Proces.

Opis Discretization

Domyślnie podczas tworzenia modelu neuronowe sieci, który ma atrybut numeryczny przewidywalne algorytm Microsoft Network neuronowe traktuje jako ciągły numer atrybutu.Na przykład atrybut ServiceGrade jest liczbą, która teoretycznie dla zakresu od 0,00 (odpowiedzieć na wszystkie wywołania) 1.00 (wszystkie obiekty wywołujące Rozłącz).W tym zestawie danych wartości mają następujące dystrybucji:

distribution of service grade values

W rezultacie podczas przetwarzania modelu dane wyjściowe mogą być pogrupowane inaczej niż można by oczekiwać.Na przykład domyślny model, który używa klastrowanie, aby znaleźć grupy wartości, dzieli ServiceGrade na zakresach, takie jak to: 0.0748051948 - 0.09716216215.Mimo że ta grupowanie jest matematycznie dokładne, takie zakresy może nie być tak istotnych dla użytkowników biznesowych.Inny sposób grupowania wartości liczbowe, można utworzyć jego kopię lub wielu kopii kolumna danych numerycznych i określić, jak algorytmu wyszukiwanie danych ma być przetwarzana wartości.Na przykład można określić, że algorytm podzielić wartości nie więcej niż pięć pojemników.

Usługi Analysis Services oferuje różne metody binning lub przetwarzania danych liczbowych.W poniższej tabela pokazano różnice między wyniki, gdy atrybut danych wyjściowych ServiceGrade zostało przetworzone trzy różne sposoby:

  • Traktując ją jako liczbę ciągłe

  • O algorytm dyskretyzować wartości przez najlepszą możliwą metoda, co się dzieje z się klastrowanie

  • Określanie, że numery można binned metodą równe obszary

Domyślny model (ciągłe)

Binned przez klastrowanie

Binned według obszarów równe

VALUEPOMOC TECHNICZNA
Brak0
0.09875120
VALUEPOMOC TECHNICZNA
< 0.074805194834
0.0748051948 - 0.0971621621527
0.09716216215 - 0.1329729729539
0.13297297295 - 0.16749999997510
>= 0.16749999997510
VALUEPOMOC TECHNICZNA
< 0.0726
0.07 - 0.0022
0.09 - 0.1136
>= 0.1236

W tej tabela kolumnie wartości pokazuje, w jaki sposób zaksięgowania ciągły numer, a kolumna SUPPORT pokazuje, ile wierszy znaleziono o tę wartość, zakres lub wartości typu.Aby uzyskać więcej informacji na temat opcji binning zobacz Metody discretization (wyszukiwanie danych).

Uwaga

Te statystyki z węzła marginalna statystyki modelu, można uzyskać po wszystkich danych została przetworzona.Aby uzyskać więcej informacji na temat węzła marginalna statystyk Zobacz model wyszukiwania Zawartości dla neuronowe modele sieci (Analysis Services — wyszukiwanie danych).

Alternatywnie zamiast używać wartości liczbowych, można dodać osobne kolumna pochodna, takie jak klasyfikuje klas usługa w zakresach docelowym wstępnie zdefiniowanych Najlepsze (ServiceGrade < = 0.05), Dopuszczalne (0,10 > ServiceGrade > 0,05), a Niska (ServiceGrade > = 0,10).

Tworząc kopię kolumna i zmienić metoda Discretization

W polu wyszukiwanie danych usług Analysis Services, można łatwo zmienić sposób, w jaki dane liczbowe są binned w ramach struktura wyszukiwania przez dodanie kolumna zawierające dane domiejsce doceloweowej i zmienić metoda discretization kopii.

Poniższa procedura opisuje sposób utworzyć kopię kolumna wyszukiwania, która zawiera atrybut miejsce docelowe ServiceGrade.Można utworzyć wiele kopii każdej kolumna struktura wyszukiwania, tym przewidywalne atrybut.

Następnie będzie można dostosować grupowanie wartości liczbowych kolumna skopiowany, należy zmniejszyć złożoność grupowania.Ten samouczek będzie należy użyć metoda discretization równe obszary i określić cztery pakiety.Grupowanie, wynikające z tej metoda są dość blisko wartości miejsce docelowe, przydatne dla użytkowników biznesowych.

Uwaga

Podczas wstępnego eksploracji danych można również eksperymentować z różnymi metodami discretization lub spróbuj najpierw klastrowanie danych.

Aby utworzyć kopię dostosowane kolumna w strukturze wyszukiwania

  1. W programie eksplorator rozwiązań kliknij dwukrotnie struktura wyszukiwania, która właśnie została utworzona.

  2. Na karcie struktura wyszukiwania kliknij przycisk Dodawanie kolumna struktury wyszukiwania.

  3. W Zaznacz kolumnę okno dialogowe ServiceGrade wybierz z listy w Kolumna źródłowa, następnie kliknij przycisk OK.

    Nowa kolumna jest dodawany do listy kolumn struktura wyszukiwania.Domyślnie nowe kolumna wyszukiwania ma taką samą nazwę jak istniejącą kolumna, za pomocą przyrostkowo numeryczny: na przykład ServiceGrade 1. Można zmienić nazwę kolumna, to być bardziej opisową.

    Można także określić metoda discretization.

  4. Kliknij prawym przyciskiem myszy ServiceGrade 1 i wybierz polecenie Właściwości.

  5. W Właściwości okno ZnajdźNazwa właściwość i zmiany nazwy na Wywołanie Centrum Binned NN.

  6. Okno dialogowe pojawi się monit, czy konieczne jest wprowadzenie zmian w tej samej nazwy wszystkich powiązanych model wyszukiwania kolumn.Kliknij przycisk Nr.

  7. W Właściwości oknie zlokalizować sekcji Typ danych i w razie potrzeby je rozwinąć.

  8. Zmień wartość właściwość Content z Continuous Aby Discretized.

    Dostępne są następujące właściwości.Zmienić wartości właściwości, jak pokazano w poniższej tabela:

    Właściwość

    Wartość domyślna

    Nowa wartość

    DiscretizationMethod

    Continuous

    EqualAreas

    DiscretizationBucketCount

    Wartość nie

    4

    Uwaga

    Wartość domyślna DiscretizationBucketCount() faktycznie jest 0, co oznacza, że algorytm automatycznie określa optymalną liczba przedziałów. Dlatego jeśli chcesz przywrócić jego domyślną wartość tej właściwość, wpisz 0.

  9. W Konstruktorze wyszukiwanie danych, kliknij przycisk Modele wyszukiwania tab.

    Zauważyć, że po dodaniu kopię struktura wyszukiwania kolumna, Flaga użycie kopii automatycznie jest ustawiona na Ignore. Zazwyczaj podczas kopiowania kolumna zostanie dodana do struktura wyszukiwania, do analizy wraz z oryginalnym kolumna nie może użyć kopii lub algorytm znajdują się mocne korelacji między dwoma kolumnami, które mogą zasłaniać inne relacje.

Dodawanie nowego model wyszukiwania struktura wyszukiwania

Teraz, gdy utworzono nowe grupowanie dla atrybut lokalizacji miejsce docelowe, należy dodać nowy model wyszukiwania używającej kolumna wartości dyskretnych.Gdy skończysz, the CallCenter struktura wyszukiwania będzie miał dwa modele wyszukiwania:

  • Model wyszukiwania, wywołanie Centrum domyślne NN, obsługi wartości ServiceGrade jako ciągłego zakres.

  • Model wyszukiwania, wywołanie Centrum Binned NN, discretizes wartości ServiceGrade na cztery różne pakiety.

Aby dodać model wyszukiwania, oparty na nowej kolumna discretized

  1. W programie eksplorator rozwiązań kliknij prawym przyciskiem myszy właśnie utworzone, i wybierz opcję Struktura wyszukiwania Otwórz.

  2. Kliknij przycisk Modele wyszukiwania tab.

  3. Kliknij przycisk Utwórz pokrewnych model wyszukiwania.

  4. W Nowy model wyszukiwania okno dialogowe, aby Nazwa modelu, type Wywołanie Centrum Binned NN.W Nazwa algorytmu rozwijaną listę, wybierz opcję Microsoft Network neuronowe.

  5. Na liście kolumn zawartych w nowym model wyszukiwania zlokalizuj ServiceGrade i zmienić korzystaniu z Predict Aby Ignore.

  6. Podobnie zlokalizuj Binned ServiceGrade i zmienić korzystaniu z Ignore Aby Predict.

Zazwyczaj użytkownik nie może porównać modeli wyszukiwania, używających różnych przewidywalne atrybutów.Jednak w SQL Server 2008, można utworzyć alias dla kolumna model wyszukiwania. Oznacza to aby miała taką samą nazwę jak oryginalne kolumna można zmienić nazwę kolumna Binned ServiceGrade wewnątrz model wyszukiwania.Następnie bezpośrednio porównanie tych dwóch modeli na wykresie dokładności nawet wtedy, gdy dane są inaczej discretized.

Aby dodać alias a struktura wyszukiwania kolumn w model wyszukiwania

  1. W Modele wyszukiwania karcie w obszarzeStruktura, wybierz opcję Binned ServiceGrade.

    Należy zauważyć, że Właściwości okna są wyświetlane właściwości obiektu ScalarMiningStructure kolumna.

  2. kolumna dla model wyszukiwania, Binned ServiceGrade NN, kliknij komórka odpowiadającą kolumnie Binned ServiceGrade.

    Uwaga ta teraz Właściwości okno wyświetla właściwości dla obiektu MiningModelColumn.

  3. Zlokalizuj Nazwa właściwość i zmień wartość ServiceGrade.

  4. Zlokalizuj Opis właściwość i wpisz Alias tymczasową kolumna.

    The Properties window should contain the following information:

    Właściwość

    Wartość

    Description

    Alias tymczasową kolumna

    Identyfikator

    ServiceGrade Binned

    Modelowanie flagi

      

    Imię i nazwisko

    Usługa klasy

    Identyfikator elementu SourceColumn

    Usługa klasy 1

    Sposób użycia

    Przewidywanie

  5. Kliknij w dowolnym miejscu model wyszukiwania tab.

    Siatka zostanie zaktualizowana tak, aby wyświetlić nowy alias tymczasową kolumna, ServiceGrade, obok użycia kolumna.Siatka zawierające struktura wyszukiwania i dwóch modeli wyszukiwania powinien wyglądać następująco:

    Struktura

    Domyślne Centrum wywołanie NN

    Wywołanie Centrum Binned NN

      

    Microsoft Network neuronowe

    Microsoft Network neuronowe

    AutomaticResponses

    Dane wejściowe

    Dane wejściowe

    AverageTimePerIssue

    Przewidywanie

    Przewidywanie

    Wywołania

    Dane wejściowe

    Dane wejściowe

    DayOfWeek

    Dane wejściowe

    Dane wejściowe

    FactCallCenterID

    Klucz

    Klucz

    IssuesRaised

    Dane wejściowe

    Dane wejściowe

    LevelOneOperators

    Dane wejściowe

    Dane wejściowe

    LevelTwoOperators

    Dane wejściowe

    Dane wejściowe

    Zamówienia

    Dane wejściowe

    Dane wejściowe

    ServceGrade Binned

    Ignoruj

    Przewidywanie (ServiceGrade)

    ServiceGrade

    Przewidywanie

    Ignoruj

    SHIFT

    Dane wejściowe

    Dane wejściowe

    Operatorzy całkowita

    Dane wejściowe

    Dane wejściowe

    WageType

    Dane wejściowe

    Dane wejściowe

Przetwarzanie modelu

Na koniec, w celu zapewnienia, że zostały utworzone modele są porównywalne, który będzie zestaw parametr siewnego domyślne i binned modeli.Ustawianie wartość początkową gwarancji, że rozpoczyna się każdy model przetwarzania danych z tego samego punktu.

Uwaga

Jeśli wartość liczbową parametru siewnego nie zostanie określony, program SQL Server Analysis Services wygeneruje siewnego, na podstawie nazwy modelu.Ponieważ model neuronowe sieci i modelu regresja logistyczne nazywają się inaczej, musisz zestaw wartość początkową, aby zapewnić, że przetwarzania danych w tej samej kolejności.

Aby określić siewnego i przetworzyć modele

  1. W Model górnictwie kartę, kliknij prawym przyciskiem myszy kolumna o nazwie Centrum Call - LR, modelu i wybierz Ustawianie parametrów algorytmu.

  2. W wierszu dla parametru HOLDOUT_SEED kliknij puste komórka w obszarze Wartość, and type 1.Kliknij przycisk OK.Powtórz ten krok dla każdego modelu związane ze strukturą.

    Uwaga

    Wartość, która zostanie wybrana opcja jako siewnego nie ma znaczenia, jeśli w używanej siewnego takie same dla wszystkich powiązanych modeli.

  3. W Modele wyszukiwania Wybierz opcję menuProces struktura wyszukiwania i wszystkie modele.Kliknij przycisk Tak wdrożyć projektu górnictwo zaktualizowane dane na serwerze.

  4. W Proces model wyszukiwania okno dialogowe kliknijUruchamianie.

  5. Kliknij przycisk Zamknij zamknięciaPostęp procesu okna dialogowego, a następnie kliknij przycisk ZamknijProces model wyszukiwania -okno dialogowe.

Teraz, gdy utworzono dwa modele powiązanych wyszukiwania będzie zapoznaj się dane, aby odkryć relacje w danych.

Historia zmian

Microsoft Learning

Samouczek scenariusz zaktualizowane do używania jednego struktura wyszukiwania zawiera wiele kopii kolumna numerycznej z każdej z kolumn discretized w różny sposób.

Dodaje objaśnienia sposobów korzystania z modeli wyszukiwanie danych, aliasy kolumna

Poprawiono nazwy model wyszukiwania w prognoz i instrukcje DDL uwzględnienie zaktualizowanych scenariusza.

Dodaje typy danych poszczególnych typów zawartości dla nowej kolumna DayOfWeek.