當您按兩下 [將模型新增至結構] 時,精靈會開始協助您建立新的採礦模型,以搭配現有的採礦結構使用。 這個選項很有用,因為它可讓您比較以相同數據為基礎的模型,或建立自定義模型。
如果 Analysis Services 的實體尚未包含您需要的數據,請使用 建立採礦結構 (SQL Server 數據採礦載入巨集) 精靈來設定採礦結構。 或者,您可以啟動其中一個模型精靈,然後將新的模型新增至精靈所建立的結構。
若要使用精靈不支持的演算法建立進階模型,請建立採礦結構,然後使用 數據採礦進階查詢編輯器新增模型。
將新的模型新增至現有的結構
在 [數據採礦] 功能區上,按兩下 [ 進階] 底下的箭號,然後選取 [將模型新增至結構]。
在 [ 選取結構] 對話框中,選擇包含您想要使用之數據的結構,然後按 [ 下一步]。
提示:如果您不確定哪一個採礦結構包含您所需的資料,請使用 「文件模型」精靈 來檢視這些資料的欄位和基本統計資訊。
如果您找不到採礦結構,請檢查您目前使用的連線。 您可能需要開啟與不同伺服器的連線。
在 [ 選取採礦演算法 ] 對話框中,選擇要在新的採礦模型中使用的採礦演算法。
請注意,對話框提供比您在精靈中看到的更多選項。 您可以使用 Analysis Services 伺服器上支援的任何演算法來建立模型,前提是您的數據相容。
建議您也按兩下 [ 參數 ] 按鈕,開啟 [ 演演算法參數 ] 對話框,並在演算法上自定義參數。 此選項是建立自定義採礦模型的最簡單方式。
按 [下一步]。
在 [ 選取資料行 ] 對話框中,檢閱數據行清單,如有必要,請將數據行的使用方式變更為下列其中一個值:
輸入。 表示數據行包含可能會影響結果的變數,而且應該當做模型的輸入使用。
輸入和預測。 表示數據應該當做輸入使用,而且您也想要預測這些值。
僅預測。 表示數據不應該當做模型的輸入使用。
索引鍵。 每個模型至少需要一個鍵。 視模型類型而定,您也可以選擇其他特殊索引鍵,例如 SequenceKey 或 TimeKey。
請勿使用。 表示數據不應該用於模型中,即使存在於 結構中也一樣。
按瀏覽 (...) 按鈕,開啟 設定資料行模型旗標 對話框。
請花一分鐘的時間確認每個數據行的使用方式都適用於模型。 當您嘗試處理模型時,這是防止錯誤的重要步驟。
例如,如果您重複使用針對決策樹模型所建立的結構,並將簡單貝氏演算法套用至該模型,則具有數據類型
Numeric和內容類型Continuous的數據行必須分桶或轉換為離散變數。如果結構中的數據行不適用於新的演算法,您可以選取 [不使用] 來略過這些數據行。
在 [ 設定數據行模型旗標 ] 對話框中,檢閱或設定模型旗標,如果有的話。
建模標誌讓您可以控制空值的處理方式,以及其他事項。 如需詳細資訊,請參閱模型旗標(數據採礦)。
完成時,按兩下 [確定 ] 關閉對話框。
在 [ 完成] 對話框中,輸入新採礦模型的名稱和描述。
根據您建置的模型類型,您可能也有下列選項:
建置完成後,流覽已完成的採礦模型。
使用模型中的鑽孔穿透以訪問原始數據。
如需詳細資訊,請參閱 採礦模型的鑽研。
按兩下 [完成 ] 以儲存變更。 如同您所做的,新模型會部署至伺服器並進行處理。
相關選項
| 選項 | 評論 |
|---|---|
| 選取 [結構] 或 [模型] 對話框 | 選擇現有的挖掘結構,作為建造新模型的基礎。 您挑選的結構必須位於目前的連線上。 如果沒有,請使用 [聯機至源數據] (適用於 Excel 的數據採礦用戶端) 工具變更連線。 |
| 選取採礦演算法 對話方塊 | 數據採礦演算法清單取決於您連線的伺服器。 Analysis Services 在 Standard 和 Enterprise 版本中提供不同的演算法。 您的系統管理員可能也已新增自定義演算法。 如果您看不到任何演算法,請確認您已連線到 Analysis Services 的實例。 |
| 演算法參數 對話方塊 | 在這些設定中,您可以根據特定的分析方法參數自定義每個演算法。 您也可以設定種子,以確保模型的結果可以在多次訓練中重現。 如需詳細資訊,請參閱演算法參數(SQL Server 資料探勘增益集)。 |
| 設定數據行模型旗標 對話方塊 | 模型旗標可以藉由指定如何處理遺漏的數據來改善您的模型。 如需詳細資訊,請參閱模型旗標(數據採礦)。 |
設定數據行使用方式
當您將新的模型新增至現有的採礦結構時,您必須指定模型如何使用採礦結構中每個數據行。 您可能會發現此精靈中的選項遠比採礦結構上的選項更詳細。 為什麼?
原因是當您使用精靈一起建立模型和結構時,許多控制演算法使用數據的選項會自動設定。 不過,當您將新的模型新增至現有的模型時,您必須手動查看這些選項,並指定數據是否應該用於分析、數據類型是否正確等等。
當您將新演算法套用至現有資料時,您可能會收到錯誤訊息,但這些訊息通常會提供有關您需要進行修正以允許處理模型的詳細資訊。 一般問題包括下列各項:
模型預期與結構所包含的數據類型不同。
某些演算法只能與數位搭配使用;有些只能使用文字。 如果您的數據是新模型的錯誤類型,您可能需要修改 結構,讓模型能夠處理。
採礦結構不包含可預測的屬性。
叢集模型可以在不需要可預測值的情況下建立,但其他模型通常需要您指定一個欄位來進行預測。
數據組合與您所選擇的演算法不相容。
某些類型的分析需要根據唯一規則仔細結構化的數據。 範例是預測模型和關聯模型。 您可以輕鬆地新增相同類型的新模型,也許是使用自定義專案,但數據可能無法與其他演算法搭配使用。
需求
若要建立數據採礦模型,您必須與 Analysis Services 實例建立連線。 如需如何建立或變更連線的詳細資訊,請參閱連接到源數據(適用於 Excel 的數據採礦用戶端)。
如果您看不到想要的數據採礦結構,可能是結構已儲存至不同的實例或不同的 Analysis Services 資料庫。 如需如何變更為不同數據採礦連接的資訊,請參閱 連線到數據採礦伺服器。