Fabric 中的镜像 提供了一种简单的体验,以避免复杂的 ETL(提取转换加载),并将现有的 Snowflake 仓库数据与 Microsoft Fabric 中的其余数据集成。 可以将现有的 Snowflake 数据直接复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享方案。
有关在 Fabric 中配置用于镜像的 Snowflake 数据库的教程,请参阅 教程:从 Snowflake 配置 Microsoft Fabric 镜像数据库。
为什么在 Fabric 中使用镜像?
在 Fabric 中使用镜像时,无需将来自多个供应商的不同服务拼凑在一起。 相反,你可以享受高度集成的端到端和易于使用的产品,旨在简化分析需求,并为Microsoft、Snowflake 和 1000 年代的技术解决方案(可读取开源 Delta Lake 表格式)之间的开放和协作而构建。
内置了哪些分析体验?
镜像数据库是 结构数据仓库 中的项,不同于 仓库 和 SQL 分析终结点。
镜像会在 Fabric 工作区中创建以下项:
- 镜像数据库项。 这可实现数据工程、数据科学等下游方案。 镜像管理:
- SQL 分析终结点
每个镜像数据库都有自动生成的 SQL 分析终结点 ,在镜像进程创建的增量表的基础上提供丰富的分析体验。 用户可以访问熟悉的 T-SQL 命令,这些命令可以定义和查询数据对象,但不能作 SQL 分析终结点中的数据,因为它是只读副本。 可以在 SQL 分析终结点中执行以下作:
- 浏览从 Snowflake 引用 Delta Lake 表中数据的表。
- 在不编写代码行的情况下,不直观地创建代码查询和视图并浏览数据。
- 开发 SQL 视图、内联 TVF(表值函数)和存储过程,以在 T-SQL 中封装语义和业务逻辑。
- 管理对象的权限。
- 在同一工作区中查询其他仓库和 Lakehouses 中的数据。
除了 SQL 查询编辑器,还有一个广泛的工具生态系统,可以查询 SQL 分析终结点,包括 SQL Server Management Studio (SSMS),使用 Visual Studio Code 的 mssql 扩展,甚至 GitHubCopilot。
安全注意事项
若要启用 Fabric 镜像,需要具有以下权限的 Snowflake 数据库的用户权限:
CREATE STREAMSELECT tableSHOW tablesDESCRIBE tables
有关详细信息,请参阅 Snowflake 文档,了解 流式处理表的访问控制权限 和 流所需的权限。
重要
源 Snowflake 仓库中建立的任何精细安全性必须在 Microsoft Fabric 的镜像数据库中重新配置。 有关详细信息,请参阅 Microsoft Fabric 中的 SQL 粒度权限。
配置 Snowflake 于防火墙后进行镜像
检查网络要求以访问 Snowflake 数据源。 如果 Snowflake 数据源不可公开访问且位于专用网络中, 请创建虚拟网络数据网关 或 安装本地数据网关 以镜像数据。 Azure 虚拟网络或网关计算机的网络必须通过专用终结点连接到 Snowflake 实例,或者防火墙规则允许。 若要开始,请参阅 教程:从 Snowflake 配置 Microsoft Fabric 镜像数据库。
镜像雪花成本注意事项
用于将数据复制到 Fabric OneLake 的构造计算是免费的。 镜像存储成本取决于容量的限制。 有关详细信息,请参阅镜像和Microsoft构造定价的成本。 使用 SQL、Power BI 或 Spark 查询数据的计算按常规费率收费。
Fabric 不向 OneLake 收取网络数据流入镜像的费用。
数据镜像时,Snowflake 计算和云查询成本为:虚拟仓库计算和云服务计算。
- Snowflake 虚拟仓库计算费用:
- 如果在 Snowflake 中读取数据更改,并且反过来又镜像到 Fabric 中,则会对 Snowflake 端收取计算费用。
- 任何元数据查询在后台运行,以检查数据更改不收取任何 Snowflake 计算费用;但是,生成数据的查询(例如
SELECT *,将唤醒 Snowflake 仓库),计算将收费。
- Snowflake 服务计算费用:
- 尽管后台任务没有任何计算费用,例如创作、元数据查询、访问控制、显示数据更改,甚至 DDL 查询,但存在与这些查询相关的云成本。
- 根据你拥有的 Snowflake 版本类型,你将因任何云服务成本而收取相应的额度。
在以下屏幕截图中,可以看到要镜像到 Fabric 的关联 Snowflake 数据库的虚拟仓库计算和云服务计算成本。 在此方案中,大多数云服务计算成本(以黄色为单位)来自之前提到的点的数据更改查询。 虚拟仓库计算费用(蓝色)严格来自从 Snowflake 读取的数据更改,并镜像到 Fabric 中。
有关 Snowflake 特定云查询成本的详细信息,请参阅 Snowflake 文档:了解总体成本。