策劃 Genie 空間是為了建立環境,讓商務使用者可根據資料提出自然語言問題,獲得準確的一致答案。 Genie 空間使用進階模型產生複雜的查詢,以及理解一般世界知識。
大多數商務問題都是領域特定的,因此空間策展人的角色是彌合該一般世界知識與特定領域或特定公司所使用的特殊語言之間的差距。 策展人會使用元數據和指示來協助 Genie 準確地解譯和響應商務用戶的問題。 本文概述最佳做法和原則,引導您順利開發空間。
定義新空間的最佳做法
在打造你的精靈空間時,請記住以下指導原則:
- 提供簡潔且聚焦的資料集:解決欄位歧義,並使用檢視或 度量檢視預先連接或非正規化資料表。 簡化的資料集提升了 Genie 準確回答資料問題的能力。
- 優先使用SQL表達式與範例SQL而非文字指令:使用SQL表達式定義商業語意,如指標與過濾器。 用範例 SQL 教 Genie 如何處理常見且模糊的提示。 預留文本指示以作為不符合結構化定義的一般指引。
- 撰寫清晰且具體的文字指示:避免模糊的指示。 例如,將「當被問及銷售時請問清楚問題」,而不是寫成「當使用者詢問銷售指標但未指定產品名稱或銷售通路時,請問:若要進行銷售分析,請指定你的產品名稱與銷售通路。」
- 避免指令衝突:確保所有指令類型保持一致。 例如,如果文字指令指定將小數數四捨五入為兩位數,那麼範例 SQL 查詢也必須四捨五入到兩位數。
以下章節提供詳細的空間建構建議及解決精度問題。
從小規模開始
策劃和組織 Genie 空間是一個循環漸進的過程。 建立新的空間時,一開始規模請盡量小,搭配最少的指令和有限的待回答問題組。 然後,您可以在根據意見反饋進行迭代的過程中添加更多內容。 這種方法有助於簡化建立及維護空間,並可讓您回應真正的使用者需求,有效策劃空間。
使用下列指導方針,協助建立小型 Genie 空間:
- 保持專注:只包含回答您想要空間處理之問題所需的數據表。 以五個或更少的資料表為目標。 選擇的項目越集中越好。 不妨讓空間僅聚焦於少量資料,限制包含之資料表中的資料行數目。
- 在 25 個表格限制內工作:Genie 空間最多支援 25 個表格或視圖。 如果你的主題資料需要超過 25 個資料表,請先將相關資料表預先合併成檢視表或 指標檢視表,再新增到你的空間。 度量視圖對精靈空間特別有效,因為它們預先定義了度量、維度與聚合。 這種方法可以幫助您保持在限制範圍內,簡化您的資料模型,並可以提高 Genie 的回應準確性。 請參閱 管理資料物件, 以取得將資料物件新增至空間的詳細資訊。
- 規劃逐步改進:從您的空間簡單的配置開始,著重於基本的表格和基本說明。 隨著時間的推移,持續改善空間時,新增更詳細的指引和範例,而不是一開始就追求完美。
- 以批注良好的數據表為基礎:Genie 使用 Unity 目錄數據行名稱和描述來產生回應。 清晰的資料行名稱和描述有助於產生高品質的回覆。 欄位描述應提供精確的上下文資訊。 避免模棱兩可或不必要的詳細資料。 檢查任何 AI 生成的描述的準確性和清晰度,並且僅當它們與您手動提供的內容一致時才使用它們。
請領域專家定義空間
有效的空間創造者需要了解數據及其可以獲得的洞察力。 精通 SQL 的資料分析師通常具備策劃空間的知識和技能。
定義空間的用途
識別空間的特定物件和用途,可協助您決定要使用的數據、指示和測試問題。 空間應回答特定主題與對象的問題,而非跨各種領域的一般問題。 在將資料加入空間之前,您可以透過預先合併資料表和刪除不必要的欄位來簡化數據集。 當您將數據新增至空間時,請將其緊密聚焦於空間的已定義用途。 隱藏任何可能令人困惑或不重要的數據欄。 請參閱隱藏或顯示相關欄。
新增元數據和同義字
您可以將欄位的同義字和自訂描述新增至 Genie 空間中的資料。 此元數據的範圍是您的 Genie 空間,且不會覆寫儲存在 Unity 目錄中的元數據。 質量數據行描述和同義字可協助 Genie 進一步了解數據行、針對相關問題選擇數據行,以及撰寫更精確的 SQL。 請參閱 編輯欄中繼資料。
使用 Genie 提示匹配
提示匹配讓 Genie 能匹配與使用者問題最相關的值,並修正使用者提示中的拼字問題。 這提升了 Genie 的準確性,因為它能更好地將使用者提示與正確的欄位和值匹配。 當你加入表格到空間時,Genie 會自動提供提示匹配。 你可以管理哪些欄位啟用了提示匹配。 請參閱 管理資料物件 和 建立知識存放區以獲得更可靠的 Genie 空間。
提供專注的範例和指示
Genie 空間在有限且集中指示集的情況下表現最佳。 Databricks 建議利用範例 SQL 查詢,在您的空間中提供指示。 範例 SQL 查詢可讓 Genie 比對使用者提示以驗證的 SQL 查詢,並從範例中學習以回答相關問題。 請參閱 新增範例 SQL 查詢和函式。
對於應在 Genie 空間中全域套用的內容,一組組織良好的小型純文本指示也有助於保持相關性並改善回應品質。 太多指示可以降低效率,特別是在較長的交談中,因為 Genie 可能難以排定最重要的指引優先順序。 如需詳細資訊,請參閱 提供指示。
選擇正確的指令類型
使用下列準則在 SQL 運算式和範例 SQL 查詢之間做出決定:
- 使用常見業務術語的 SQL 運算式:定義代表標準業務概念的常用指標、篩選器或維度時,請在知識存放區中使用 SQL 運算式。 SQL 表達式是高效、可重複使用的定義,可幫助 Genie 理解您的業務邏輯。 範例包括毛利率、近期銷售額和轉換率。 請參見 定義 SQL 表達式。
- 使用示例 SQL 查詢處理複雜問題: 在解決難以解釋、多部分或複雜問題時,提供完整的示例 SQL 查詢。 這些範例展示了 Genie 如何處理複雜的查詢模式和多步驟邏輯。 例如,您可以針對「分解我的團隊績效」或「對於最近才加入的客戶,哪些產品表現最好?」等提示建立 SQL 查詢。 請參閱 新增範例 SQL 查詢和函式。
提示讓 Genie 提出釐清問題
要在特定情境下促使精靈提出澄清問題,請明確說明何時提出澄清以及如何跟進。 使用明確且具體的指示,明確定義觸發條件及預期的澄清行為。
例如,在你的空間中加入以下類型的指令:
當使用者詢問銷售績效細分,但未包含時間範圍、銷售管道或 KPI 時,你必須先提出澄清問題以收集必要資訊。 例如:「請明確指出您想要的時間範圍和銷售管道。」
請用以下部分來結構你的說明說明:
- 觸發條件:定義哪些主題或情境需要澄清(例如,「當使用者詢問 X 主題時......」)
- 缺少細節:指定必須包含哪些資訊(例如「...但不包含Y細節......」)
- 必要行動:說明精靈必須要求澄清(例如,「...你必須先問一個澄清問題......」)
- 範例說明:提供精靈應該問的具體問題(例如:「請具體說明......」)
在一般說明的最後加入澄清問題的指示,幫助精靈在回答模糊問題時優先處理這種行為。
測試和調整
您應該是空間的第一個使用者。 建立新空間之後,請開始提出問題。 請仔細檢查針對你的問題所產生的 SQL。 如果 Genie 不正確解譯資料、問題或商務術語,編輯產生的 SQL 或提供其他特定指令即可干預。 持續測試和編輯,直到您收到可靠的響應為止。
檢閱問題之後,您可以將其新增為基準問題,以系統化方式測試並評分您的空間,以提高整體精確度。 您可以使用變化和不同的問題片語來測試 Genie 的回應。 參見 在 Genie 空間中使用基準。
關於修正錯誤回應的建議,請參見 「故障排除精靈空間」。
執行使用者測試
透過測試驗證回覆品質之後,請招募商務使用者來試用 Genie 空間。 使用下列指導方針,提供順暢的使用者體驗,並收集意見反應,持續改善。
- 設定期望,他們的工作是幫助完善空間。
- 要求他們專注於特定主題的測試,以及空間設計應回答的特定主題和問題。
- 如果他們收到的回覆不正確,鼓勵使用者在聊天時新增其他指令並釐清問題,讓答案精益求精。 當提供的回覆正確無誤時,他們應該對該問題按讚,以在未來的互動中儘量減少類似錯誤。
- 請使用者使用內建的意見反應機制,附議或反對回覆。
- 邀請使用者直接與空間作者分享其他意見反應和未解決的問題。 作者和編輯可以使用意見反應來改進指令、範例和可信賴的資源。
考慮提供培訓材料或書面文件,其中包含測試空間和提供回饋的指南。 引導商務使用者 使用 Genie 空間探索商務數據 ,以協助他們開始使用新的 Genie 空間。
當業務使用者測試空間時,至少具有「可以管理」權限的使用者可以在 「監控」 標籤上看到他們提出的問題。繼續添加上下文,幫助 Genie 正確解讀問題和數據,從而提供準確的答案。 若要深入瞭解監視 Genie 空間,請參閱 監視空間 。 您也可以使用稽核記錄來監視 Genie 空間的反饋和審查請求。 請參閱 使用稽核記錄和警示監視 AI/BI 使用量。
Note
商務使用者必須是原始工作區的成員,才能存取空間。 請參閱 必要許可權 ,以瞭解如何提供適當的許可權來與空間互動。
關於 Genie 空間常見問題的故障排除,請參見 「Troubleshoot Genie spaces」。