共用方式為


為您的案例選擇正確的整合執行階段設定

整合執行階段 (IR) 是 Microsoft Purview 用來支援不同網路環境資料掃描的計算基礎結構。 本文介紹 Microsoft Purview 中可用的不同類型的整合執行階段,並提供如何為您的案例選擇正確整合執行階段設定的指引。

整合執行階段的類型

Microsoft Purview 提供下列類型的整合執行階段:

  • Azure 整合執行階段:Azure 整合執行階段是完全受控的彈性計算,可用來掃描 Azure 或非 Azure 資料來源。 Azure IR 支援連線至具有可公開存取端點的資料存放區和計算服務。 這是預設的整合執行階段,您不需要建立任何專案即可開始使用。

  • 受控 虛擬網路 (VNet) 整合執行階段:您可以建立位於 Microsoft Purview 受控虛擬網路中的受控 VNet 整合執行階段。 它可以使用私人端點來安全地連線並掃描支援的資料來源。 如需詳細資訊,請參閱受控虛擬網路和受控私人端點

  • 自我裝載整合執行階段:自我裝載整合執行階段可用來掃描內部部署網路或虛擬網路中的資料來源。 您可以將其安裝在內部部署機器或專用網路內的虛擬機器上。 如需詳細資訊,請參閱 建立和管理自我裝載的整合執行階段

  • Kubernetes 支援的自我裝載整合執行階段:此整合執行階段裝載於 Kubernetes 叢集上,可用來掃描內部部署網路或虛擬網路中的資料來源。 Kubernetes 支援可改善整體效能,並允許整合執行階段隨著作業進行調整。 如需詳細資訊,請參閱 建立和管理 Kubernetes 支援的自我裝載整合執行階段

  • AWS 整合執行階段:AWS 整合執行階段是由 AWS 中的 Microsoft Purview 裝載的完全受控且彈性的計算。 它適用於掃描 S3、RDS 等 Amazon 資料來源。

選擇正確的整合執行階段

請務必選擇適當的整合執行階段類型。 它不僅必須適合您現有的架構和資料整合需求,而且您還需要考慮如何進一步滿足不斷增長的業務需求和未來工作負載的任何增加。

以下考慮因素可以幫助您做出決定:

  1. 您要掃描哪些資料來源類型?

    請檢查 支援的資料來源 區段,以瞭解您要掃描的資料來源支援的 IR 類型。

  2. 資料來源的網路存取控制是什麼?

    不同的資料來源可能有不同的網路防火牆設定,以保護其免受網際網路的隨機存取,可能是內部部署或雲端/SaaS 資料存放區。 下表列出一些常見的防火牆選項。 您可以根據您的場景選擇支持的 IR 類型。

    資料來源防火牆 Azure IR 受控虛擬網路 IR 雪莉 Kubernetes 支援的 SHIR
    允許公開存取
    允許 Azure 服務受信任的服務
    允許從特定 Azure 虛擬網路存取 ✓ (具有託管私人端點支持)
    允許特定 IP/IP 範圍
    其他內部部署或專用網路存取
  3. Microsoft Purview 的防火牆設定為何?

    Microsoft Purview 提供不同的網路防火牆選項。 深入瞭解 設定 Microsoft Purview 防火牆。 您可以根據您的場景選擇支持的 IR 類型。

    Purview 防火牆 Azure IR 受控虛擬網路 IR 雪莉 Kubernetes 支援的 SHIR
    從所有網路啟用
    從所有網路停用 ✓ (所需的受控私人端點) ✓ (需要從您的網絡) 創建專用端點 ✓ (需要從您的網絡) 創建專用端點
  4. 資料傳輸過程中需要什麼等級的安全性?

    整合執行階段位置會定義其後端計算的位置,以及執行掃描作業的位置。 針對資料落地考量:

    • 當您使用 Azure IR 時,Microsoft Purview 會自動偵測資料來源的位置,並使用該區域中的 IR。 如果 Microsoft Purview 無法偵測到區域,則會使用 Purview 帳戶的區域。
    • 當您使用受控虛擬網路 IR 時,它會在您針對受控虛擬網路設定的區域中執行。
    • 當您使用 SHIR 時,您可以完全決定內部部署或 Azure 虛擬機器中的位置。

    例如,若要防禦資料傳輸期間的中間人攻擊,您可以選擇使用私人端點和 Private Link 來確保資料安全性。

    • 使用受控虛擬網路 IR 時,您可以建立資料存放區的受控私人端點。 私人端點是由受控虛擬網路內的 Microsoft Purview 服務維護。
    • 您也可以在虛擬網路中建立私人端點,而 SHIR 可以使用它們來存取資料存放區。
  5. 你們能夠提供什麼程度的維護?

    維護基礎設施、伺服器和設備是企業IT部門的重要任務之一。 這通常需要花費大量的時間和精力。

    • 使用 Azure IR 和受控虛擬網路 IR 時,您不需要擔心維護,例如更新、修補程式和版本。 Microsoft Purview 服務會處理所有維護工作。
    • 由於 SHIR 已安裝在您的機器上,而 Kubernetes 支援的 SHIR 位於 Kubernetes 叢集上,因此您需要管理維護。
  6. 效能與延展性

    建議您在適用時使用完全受控和自動調整的 Azure IR、受控虛擬網路 IR,或 Kubernetes 支援的自我裝載整合執行階段。 憑藉彈性,它們可以為您提供更好的性能和可擴展性,尤其是在掃描大規模數據系統時。

支援的資料來源

下表顯示 Microsoft Purview 掃描支援的所有資料來源,以及支援的整合執行階段類型。

類別 支援的資料存放區 Azure IR/AWS IR 受控虛擬網路 IR 雪莉 Kubernetes SHIR
Azure 多個來源
Azure Blob 儲存體 ✓ (包括受控私人端點)
適用於 NoSQL) 的 Azure Cosmos DB (API ✓ (包括受控私人端點)
Azure 資料總管 ✓ 僅 (v2)
Azure Data Lake Storage Gen1 ✓ 僅 (v2)
Azure Data Lake Storage Gen2 ✓ (包括受控私人端點)
適用於 MySQL 的 Azure 資料庫 ✓ (包括受控私人端點)
適用於 PostgreSQL 的 Azure 資料庫 ✓ (包括受控私人端點)
Azure Databricks Hive 中繼存放區
Azure Databricks Unity 目錄 ✓ 僅限 (v2,包括受控私人端點)
Azure 專用 SQL 集區 (先前稱為 SQL DW) ✓ (包括受控私人端點)
Azure 檔案 ✓ (包括受控私人端點)
Azure SQL Database ✓ (包括受控私人端點)
Azure SQL 受控執行個體 ✓ (包括受控私人端點)
Azure Synapse Analytics (Workspace) ✓ (包括受控私人端點)
Database Amazon RDS
Amazon Redshift
Cassandra ✓ 僅 (v2)
Db2
Google BigQuery
蜂巢中繼存放區資料庫
MongoDB
MySQL ✓ 僅限 (v2,包括受控私人端點)
Oracle
PostgreSQL ✓ 僅 (v2)
SAP 商務倉儲
SAP HANA
Snowflake ✓ 僅 (v2)
SQL Server
Azure-Arc 上的 SQL Server
Teradata
檔案 Amazon S3
HDFS
服務和應用程式 Dataverse ✓ 僅 (v2)
Erwin
Looker ✓ 僅 (v2)
✓ 僅 (v2)
Power BI ✓ 僅 (v2)
Qlik Sense ✓ 僅 (v2)
Salesforce ✓ 僅 (v2)
SAP ECC
SAP S/4HANA
Tableau ✓ 僅 (v2)