適用於 Excel 的數據採礦用戶端是一組工具,可讓您執行一般數據採礦工作,從數據清理到模型建置和預測查詢。 您可以使用 Excel 資料表或範圍中的數據,或存取外部數據源。
-
將數據載入 Excel、清理數據、檢查極端值,以及建立統計摘要。 您也可以使用外部數據來執行不同類型的取樣、分析數據,以及測試模型。 數據採礦客戶端是準備數據以進行分析的最簡單方式,而不需要複雜的腳本或 ETL 程式。
-
這些工具提供精靈介面給已知、經過經驗測試的數據採礦演算法,包括群集(K-means 和 EM)、關聯分析、時間序列分析和判定樹。 每個精靈的進階模型化選項可讓您選擇不同的演算法,例如貝氏機率或神經網路,以及自定義叢集種子或初始取樣大小等行為。
所有數據採礦演算法都會裝載在 Analysis Services 的實例中,讓您更有能力建置複雜的模型。
-
數據採礦用戶端提供業界標準工具來測試模型,包括增益圖和交叉驗證。 提供的精靈可讓您輕鬆地測試數據集的有效性及其精確度。 查詢精靈會建置查詢,以使用模型進行預測和評分。
-
大部分工具所產生的圖表可以直接儲存至 Excel。 使用 Excel 中的瀏覽模型(SQL Server 資料探勘增益集) 工具來探索模型。
-
適用於 Excel 的數據採礦用戶端會維護伺服器的作用中連線,因此您可以將數據採礦模型儲存至伺服器、用於進一步測試,或部署至生產伺服器以取得更大的延展性。
與數據合作
數據準備群組包含下列精靈,可協助您檢閱和清除數據,以準備數據採礦工作。 大部分的工具精靈也可讓您將數據分成訓練數據集和測試數據集。
資料探索(SQL Server 資料探勘外掛程式)
若要建置和儲存模型,增益集支持這些資料連線:
連接到 Analysis Services 伺服器,以便儲存和處理模型。
外部數據源的可選連接。 您可以使用任何可定義為 Analysis Services 數據源的數據類型來建置模型,或只使用 Excel 中的數據。
資料探索(SQL Server 資料探勘外掛程式)
[ 探索數據 精靈] 可藉由一次繪製所選數據行的分佈和值,協助您了解數據表中的數據類型和數量。
範例資料(SQL Server 資料探勘增益集)
建立適合用於定型和測試模型的數據種類是數據採礦的一個重要部分,但如果沒有正確的工具,可能會很乏味。
範例資料向導可以輕鬆地將用於模型的資料分成兩個群組,一個用於建置模型,另一個用於測試模型。 您可以使用隨機取樣或過度取樣。
預測計算機(適用於 Excel 的數據表分析工具 )
移除極端值 精靈提供數個工具來識別並適當處理極端值。 它會顯示值分佈,以及極端值與其他數據的關聯性,並可讓您決定要移除或變更極端值。
預測計算機(適用於 Excel 的數據表分析工具 )
Relabel 精靈可協助您為數據建立新的標籤,讓您更輕鬆地瞭解分析的結果。 例如,您可以重新命名具有更描述性名稱的數據範圍,或從清單中選擇代表性值。
建置模型和分析
工具列 [ 數據模型化] 區段上的選項可讓您從數據衍生模式;根據屬性分組數據列,或探索關聯。 此工具功能區中的精靈是以 Analysis Services 中可用的強大數據採礦演算法為基礎。 不同於 Excel 資料表分析工具中的類似工具,這些精靈可讓您自定義演算法的行為,並使用各種數據源。
分類精靈(適用於 Excel 的資料探勘加載項)
[分類精靈] 可協助您根據 Excel 數據表、Excel 範圍或外部數據源中的現有數據來建置分類模型。 分類模型會擷取數據中的模式,指出相似性,並協助您根據值的群組進行預測。 例如,分類模型可用來根據收入或支出模式預測風險。
分類精靈支援使用這些Microsoft數據採礦演算法:判定樹演算法、羅吉斯回歸、貝氏機率分類、類神經網路。
估計精靈 (適用於 Excel 的資料探勘附加元件)
[ 估計 精靈] 可協助您建立估計模型。 估計模型會從數據擷取模式,並使用模式來預測數值結果,例如貨幣、銷售量、日期或時間。
[估計] 精靈會使用這些Microsoft數據採礦演算法:判定樹、線性回歸、羅吉斯回歸和類神經網路。
分析關鍵影響因素 (適用於 Excel 的數據表分析工具)
[叢集精靈] 可協助您建置叢集模型。 叢集模型會偵測共用類似特性的數據列群組。 此精靈適用於探索各種數據中的模式。
群 集 精靈會使用 Microsoft 群集演算法,其中包含 K-means 和 EM。
關聯精靈 (適用於 Excel 的數據採礦用戶端)
[ 關聯 精靈] 可協助您使用Microsoft關聯規則演算法來建立數據採礦模型,該演算法會偵測經常發生的專案或事件。 這類關聯模型特別適用於提出建議。
[關聯精靈] 會使用Microsoft關聯規則演算法。
預測精靈(適用於 Excel 的數據採礦附加元件)
[預測精靈] 可協助您預測時間序列中的值。 一般而言,您在預測中使用的數據包含某種時間序列、日期戳記或某些序列標識元,並用它來衍生用於預測未來值的模式。
預測精靈會使用Microsoft時間序列演算法。
進階建模(適用於 Excel 的資料挖掘增益集)
已經熟悉數據採礦嗎? 您可以使用進 階 數據模型化選項來建立自定義數據結構,並使用其他工具和精靈中未包含的自定義專案來建置模型。
測試、查詢和驗證模型
使用 [精確度] 和 [驗證 ] 工具列上的精靈,使用業界標準測試來驗證模型的正確性,以及評估用於建立模型的數據集可行性。
分析關鍵影響因素 (適用於 Excel 的數據表分析工具)
藉由產生增益圖或散佈圖來評估數據採礦模型的效能。
分類矩陣(SQL Server 資料探勘增益集)
藉由建立圖表來摘要模型所做出的精確且不正確的預測,協助您評估分類模型的效能。
收益圖 (SQL Server 數據採礦附加元件)
藉由繪製預測的正確性以及根據預測採取動作的成本和優點,協助您了解數據採礦模型的影響。
交叉驗證 (SQL Server 資料探勘插件)
建立報表,摘要說明模型在數據集的許多子集上的正確性,以便判斷模型有多穩定。
您也可以使用 Excel 資料表中的數據做為針對儲存在伺服器上之採礦模型的預測查詢輸入。
查詢 (SQL Server 數據採礦載入巨集)
查詢精靈可協助您針對現有的資料探勘模型建立預測。
進階數據採礦查詢編輯器
針對進階使用者,此工具會提供 DMX 的拖放介面。 您可以輕鬆地建立預測查詢或新模型,而不必擔心語法。
檢視模型
您建立的模型會自動開啟以供流覽。 不過,您也可以瀏覽伺服器上的模型,併產生新的視覺效果。 使用 Visio 圖形 將模型圖表導出至可自定義的畫布。
在 Excel 中瀏覽模型 (SQL Server 資料探勘增益集)
使用自定義至每種模型類型的互動式圖表,檢視您所建立的模型。
撰寫採礦模型文件(適用於 Excel 的資料探勘增益集)
此精靈會建立報告,以提供數據集和模型相關元數據的統計摘要,以協助調查和解譯。
管理、記錄和部署
這些工具可協助您連線到數據採礦伺服器,以及管理及導出模型,以及監視數據採礦活動。
管理模型 (SQL Server 資料探勘增益集)
如果您有必要的許可權,您可以刪除修改、重新命名或處理現有的採礦模型和結構,而不需要離開 Excel。
Trace (Excel 的資料探勘用戶端)
單擊 [追蹤 ] 以檢視 Excel 用戶端與 SQL Server 伺服器之間互動的持續擷取。 所有活動都會儲存為 DMX 或 XMLA 語句,以便對數據採礦會話進行疑難解答,或儲存資訊以供稍後使用。
聯機到數據採礦伺服器
若要使用 Excel 做為數據採礦的用戶端,您必須建立 Analysis Services 實例的連線。 該連線提供您訪問 Analysis Services 引擎。 如果您有許可權,連線也可讓您儲存您探索到的任何模式,以及修改現有的數據採礦物件。
[ 連線] 工具列提供精靈來管理 Analysis Services 實例的連接。 您必須定義 Analysis Services 實例的連接,才能使用數據採礦工具和演算法。 您可以在安裝外掛程式時建立連線,或稍後新增連線。
快速入門
按兩下 [ 開始使用 ] 按鈕以啟動設定精靈,引導您完成建立 Analysis Services 實例連線的程式,並取得執行數據採礦所需的許可權。
幫助
[ 說明 ] 下拉功能表提供在線說明、網站和設定精靈的連結,以協助您完成設定並開始數據採礦。
[說明] 頁面也會連結到網路上的資源,包括增益集的說明,以及其他影片、示範和範例。