在本教程中,你将生成一个管道,用于将 CSV 文件从 Azure Blob 存储源的输入文件夹移动到 Lakehouse 目标。
先决条件
若要开始,必须满足以下先决条件:
确保你具有已启用 Project Microsoft Fabric 的工作区:创建工作区。
选择“立即试用!”按钮,为复制准备 Azure Blob 存储数据源。 为此 Azure Blob 存储创建新的资源组,然后选择“评审 + 创建”>“创建”。
然后,创建一个Azure Blob 存储,并且 moviesDB2.csv 会上传到已创建的 Azure Blob 存储的输入文件夹。
创建管道
使用复制助手复制数据
在此会话中,你将使用以下步骤开始生成管道。 这些步骤使用复制助手将 CSV 文件从Azure Blob 存储的输入文件夹复制到湖屋目标。
步骤 1:开始使用复制助手
步骤 2:配置源
在选择筛选器中键入 blob,选择“Azure Blob”,然后选择“下一步”。
通过选择“连接”下拉列表下的“创建新连接”,提供帐户名或 URL 并创建与数据源的连接。
选择要预览的源配置中的文件 moviesDB2.csv,然后选择“下一步”。
步骤 3:配置目标
步骤 4:查看和创建复制活动
在前面的步骤中查看复制活动设置,然后选择“保存 + 运行”以完成。 或者,如果需要,可以返回到上述步骤,在工具中编辑设置。
完成后,复制活动将添加到管道画布中。如果保留选中“立即开始数据传输”复选框,则会直接运行。
运行和调度流水线
如果在“审阅 + 创建”页面上没有选中“立即开始数据传输”复选框,请切换到“开始”选项卡,然后选择“运行”。 然后选择“保存并运行”。
在“输出”选项卡上,选择具有复制活动名称的链接,以监视进度并检查运行结果。
“复制数据详细信息”对话框显示运行结果,包括状态、读取和写入的数据量、开始和停止时间以及持续时间。
还可以根据需要计划管道以特定频率运行。 以下示例显示了如何将管道安排为每 15 分钟运行一次。
相关内容
此示例中的管道演示如何将数据从 Azure Blob 存储复制到湖屋。 你已了解如何执行以下操作:
- 创建管道。
- 使用复制助手复制数据。
- 运行并调度你的流水线。
接下来,请继续了解有关监视管道运行的详细信息。