本文概述如何註冊 Teradata,以及如何在 Microsoft Purview 中驗證 Teradata 並與之互動。 如需 Microsoft Purview 的詳細資訊,請閱讀簡介 文章。
支援的功能
掃描功能
| 中繼資料擷取 | 完整掃描 | 增量掃描 | 範圍掃描 |
|---|---|---|---|
| 是 | 是 | 否 | 是 |
支援的 Teradata 資料庫版本為 12.x 至 17.x。
掃描 Teradata 來源時,Microsoft Purview 支援:
擷取技術中繼資料,包括:
- 伺服器
- 資料庫
- 表格,包括資料行、外部索引鍵、索引和條件約束
- 視圖,包括欄
- 預存程序,包括參數資料集和結果集
- 函數,包括參數 dataset
擷取資料表和檢視之間資產關係的靜態譜系。
設定掃描時,您可以選擇掃描整個 Teradata 伺服器,或將掃描範圍限定為符合給定名稱 (的) 或名稱型樣 () 的資料庫子集。
其他功能
如需 分類、 敏感度標籤、 原則、 資料譜系和 即時檢視,請參閱 支援的功能清單。
已知限制
從數據源刪除物件時,目前後續掃描不會自動移除 Microsoft Purview 中的對應資產。
掃描所需的權限
Microsoft Purview 支援掃描 Teradata (使用者名稱和密碼) 基本驗證。 使用者應該為下列每個個別系統表格授與 SELECT 權限:
grant select on dbc.tvm to [user];
grant select on dbc.dbase to [user];
grant select on dbc.tvfields to [user];
grant select on dbc.udtinfo to [user];
grant select on dbc.idcol to [user];
grant select on dbc.udfinfo to [user];
若要擷取檢視資料行的資料類型,Microsoft Purview 會針對每個檢視查詢發出準備陳述式 select * from <view> ,並剖析包含資料類型詳細資料的中繼資料,以取得更好的效能。 它需要檢視的 SELECT 資料權限。 如果缺少權限,則會略過檢視資料行資料類型。
針對分類,使用者也需要具有資料表/檢視的讀取權限,才能擷取範例資料。
必要條件
具有作用中訂用帳戶的 Azure 帳戶。 免費創建一個帳戶。
作用中的 Microsoft Purview 帳戶。
您需要資料來源系統管理員和資料讀取者許可權,才能在 Microsoft Purview 治理入口網站中註冊來源並管理來源。 如需許可權的詳細資訊,請參閱 Microsoft Purview 中的存取控制。
設定最新的 自我裝載整合執行階段。 如需詳細資訊,請參閱 建立和設定自我裝載整合執行階段指南。
請確定 JDK 11 已安裝在安裝自我裝載整合執行階段的電腦上。 新安裝 JDK 之後,重新啟動電腦,使其生效。
請確定C++ 可轉散發套件 (版本的 Visual Studio 2012 Update 4 或更新版本的) 已安裝在自我裝載整合執行階段電腦上。 如果您尚未安裝此更新,可以在此處下載。
在執行自我裝載整合執行階段的電腦上下載 Teradata JDBC 驅動程式 。 記下您將用來設定掃描的資料夾路徑。
注意事項
驅動程式應該可由自我裝載整合執行階段存取。 根據預設,自我裝載整合執行階段會使用 本機服務帳戶 “NT SERVICE\DIAHostService”。 確保它具有驅動程式資料夾的「讀取並執行」和「列出資料夾內容」權限。
登錄
本節說明如何使用 Microsoft Purview 治理入口網站在 Microsoft Purview 中註冊 Teradata。
註冊步驟
透過下列方式開啟 Microsoft Purview 治理入口網站:
- 直接 https://web.purview.azure.com 流覽並選取您的 Microsoft Purview 帳戶。
- 開啟 Azure 入口網站,搜尋並選取 Microsoft Purview 帳戶。 選取 [Microsoft Purview 治理入口網站] 按鈕。
選取左側導覽中的 資料對應 。
選擇 註冊
在 [ 註冊來源 ] 上,選取 [ Teradata]。 選取 [繼續]
在 [將來源 (Teradata) 註冊] 畫面上,執行下列動作:
輸入資料來源將在目錄中列出的 名稱 。
輸入 主機 名稱以連線至 Teradata 來源。 它也可以是伺服器的 IP 位址。
從清單中選取集合。
完成以註冊資料來源。
掃描
請依照下列步驟掃描 Teradata 以自動識別資產。 如需一般掃描的詳細資訊,請參閱我們的 掃描和擷取簡介。
建立並執行掃描
在 管理中心 中,選取 [整合執行階段]。 請確定已設定自我裝載整合執行階段。 如果未設定,請使用 此處 所述的步驟來設定自我裝載整合執行階段
選取 Microsoft Purview 治理入口網站左窗格中的 [資料對應] 索引標籤。
選取已註冊的 Teradata 來源。
選取 [ 新增掃描]
提供以下詳細資訊:
名稱:掃描的名稱
透過整合執行階段連線:選取已設定的自我裝載整合執行階段。
認證:選取要連線到資料來源的認證。 確保:
- 在建立認證時選取 [基本驗證]。
- 在「使用者名稱」輸入欄位中提供使用者名稱以連接至資料庫伺服器
- 將資料庫伺服器密碼儲存在秘密金鑰中。
若要瞭解有關認證的更多資訊,請參閱此處的連結
結構描述:要匯入的資料庫子集清單,以分號分隔的清單表示。 舉例來說:
schema1;schema2。 如果該清單是空的,則會匯入所有使用者資料庫。 預設會忽略所有系統資料庫 (例如,SysAdmin) 和物件。可接受的資料庫名稱型樣可以是靜態名稱或包含萬用字元 %。 例如:
A%;%B;%C%;D- 以 A 或
- 以 B 結尾或
- 包含 C 或
- 等於 D
不接受使用 NOT 和特殊字元
驅動程式位置:指定執行自我裝載整合執行階段所在機器中 JDBC 驅動程式位置的路徑。 例如:
D:\Drivers\Teradata。- 針對本機電腦上的自我裝載整合執行階段:
D:\Drivers\Teradata。 這是有效 JAR 資料夾位置的路徑。 此值必須是有效的絕對檔案路徑,且不包含空格。 請確定驅動程式可由自我裝載整合執行階段存取;;深入瞭解 先 決條件 一節。
- 針對本機電腦上的自我裝載整合執行階段:
預存程序詳細資料:控制從預存程序匯入的詳細資料數目:
- 簽章:預存程序的名稱和參數。
- 程式碼、簽章:預存程序的名稱、參數和程式碼。
- 譜系、程式碼、簽章:預存程序的名稱、參數和程式碼,以及從程式碼衍生的資料譜系。
- 無:不包含預存程序詳細資料。
最大可用記憶體: 客戶虛擬機器上可供掃描程序使用的記憶體 (上限(以 GB 為單位) 。 這取決於要掃描的 Teradata 來源大小。
注意事項
根據經驗,請為每 1000 張桌子提供 2GB 記憶體
選取 [繼續]。
選取要分類的 掃描規則集 。 您可以在系統預設值、現有自訂規則集之間進行選擇,或內嵌 建立新的規則集 。
選擇您的 掃描觸發器。 您可以設定排程或執行掃描一次。
檢閱您的掃描,然後選取儲存並執行。
檢視掃描和掃描執行
若要檢視現有掃描:
- 移至 Microsoft Purview 入口網站。 在左窗格中,選取 資料對應。
- 選取資料來源。 您可以在 「最近掃描」下檢視該資料來源上現有的掃描清單,也可以在 「掃描」 標籤上檢視所有掃描。
- 選取具有您要檢視結果的掃描。 窗格會顯示所有先前的掃描執行,以及每個掃描執行的狀態和度量。
- 選取執行 ID 以檢查 掃描執行詳細資料。
管理您的掃描
若要編輯、取消或刪除掃描:
移至 Microsoft Purview 入口網站。 在左窗格中,選取 資料對應。
選取資料來源。 您可以在 「最近掃描」下檢視該資料來源上現有的掃描清單,也可以在 「掃描」 標籤上檢視所有掃描。
選取您要管理的掃描。 然後您可以:
- 選取編輯 掃描,以編輯掃描。
- 選取 [取消掃描執行] 來取消進行中的掃描。
- 選取 [刪除掃描] 來刪除掃描。
注意事項
- 刪除掃描不會刪除從先前掃描建立的型錄資產。
譜系
掃描 Teradata 來源之後,您可以瀏覽整合式目錄或搜尋整合式目錄以檢視資產詳細資料。
轉到資產 -> 譜系選項卡,您可以在適用時查看資產關係。 請參閱支援的 Teradata 譜系案例中的 支援功能 一節。 如需有關譜系的詳細資訊,請參閱 資料譜系 和 譜系使用者指南。
後續步驟
現在您已註冊來源,請遵循下列指南,以深入瞭解 Microsoft Purview 和您的數據。