Fabric 中的镜像功能提供了一种简单的体验,可避免复杂的 ETL(提取转换加载),并可将现有的 Azure Database for PostgreSQL 灵活服务器资产与你在 Microsoft Fabric 中的其他数据集成在一起。 可以将现有的 Azure Database for PostgreSQL 灵活服务器直接复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享方案。
有关在 Fabric 中配置 Azure Database for PostgreSQL 灵活服务器镜像(现已正式发布)的教程,请参阅 教程:从 Azure Database for PostgreSQL 灵活服务器配置 Microsoft Fabric 镜像数据库。
为什么在 Fabric 中使用镜像?
使用 Fabric 镜像功能时,无需将来自多个供应商的不同服务拼凑在一起。 相反,您可以使用一款高度集成的、端到端的、易于使用的产品,它旨在简化您的分析需求,并为 Microsoft、Azure Database for PostgreSQL 灵活服务器以及成千上万能够读取开源 Delta Lake 表格式的技术方案之间的开放与协作而构建。
内置了哪些分析体验?
镜像数据库是 结构数据仓库 中的项,不同于 仓库 和 SQL 分析终结点。
镜像会在 Fabric 工作区中创建以下项:
Azure Database for PostgreSQL 灵活服务器中的每个镜像数据库都有自动生成的 SQL 分析终结点 ,该终结点在镜像过程创建的增量表的基础上提供了丰富的分析体验。 用户可以访问熟悉的 T-SQL 命令,这些命令可以定义和查询数据对象,但不能作 SQL 分析终结点中的数据,因为它是只读副本。 可以在 SQL 分析终结点中执行以下作:
- 浏览从 Azure Database for PostgreSQL 灵活服务器引用 Delta Lake 表中的数据的表。
- 在不编写代码行的情况下,不直观地创建代码查询和视图并浏览数据。
- 开发 SQL 视图、内联 TVF(表值函数)和存储过程,以在 T-SQL 中封装语义和业务逻辑。
- 管理对象的权限。
- 在同一工作区中查询其他仓库和 Lakehouses 中的数据。
除了 SQL 查询编辑器,还有一个广泛的工具生态系统,可以查询 SQL 分析终结点,包括 SQL Server Management Studio (SSMS),使用 Visual Studio Code 的 mssql 扩展,甚至 GitHubCopilot。
网络要求
如果灵活服务器不可公开访问,并且不允许 Azure 服务 连接到它,则可以 创建虚拟网络数据网关 来镜像数据。 确保 Azure 虚拟网络或网关计算机的网络可以通过专用终结点连接到 Azure Database for PostgreSQL 灵活服务器,或者防火墙规则允许。
活动事务、工作负载和复制程序引擎行为
活动事务将继续保留预写日志(WAL)的截断,直到事务提交且镜像的 Azure Database for PostgreSQL 灵活服务器赶上,或事务中止。 长时间运行的事务可能会导致 WAL 填满比平时更多。 应监视源 Azure Database for PostgreSQL 的灵活服务器上的 WAL,以避免存储空间被填满。 有关详细信息,请参阅 WAL 因长时间运行的事务和 CDC 而增长。
每个用户工作负荷各不相同。 在初始快照期间,对于 CPU 和 IOPS(每秒输入/输出作,读取页面),源数据库可能有更多的资源使用率。 表更新/删除作可能会导致日志生成增加。 详细了解如何 监视 Azure Database for PostgreSQL 灵活服务器的资源。
计算层支持
源 Azure Database for PostgreSQL 灵活服务器可以是常规用途或内存优化计算层。 不支持突发计算层作为镜像源。
若要详细了解 Azure Database for PostgreSQL 灵活服务器中可用的计算层,请参阅 Azure Database for PostgreSQL 灵活服务器中的计算选项。
后续步骤
相关内容
- 如何保护 Microsoft Fabric 的镜像数据库免受 Azure Database for PostgreSQL 灵活服务器的影响
- Microsoft Fabric 在 Azure Database for PostgreSQL 灵活服务器中的镜像数据库限制
- 监视 Fabric 镜像数据库复制
- 排查 Azure Database for PostgreSQL 灵活服务器中的 Fabric 镜像数据库问题