Summary
| Item | Description |
|---|---|
| 发布状态 | 正式发布 |
| Products | Excel Power BI (语义模型) Power BI (数据流) Fabric(Dataflow Gen2) Power Apps(数据流) Dynamics 365 Customer Insights |
| 支持的身份验证类型 | 匿名(在线) 基本(在线) 组织帐户(联机) Windows (联机) |
| 功能参考文档 | Pdf.Tables |
Note
由于部署计划和主机特定的功能,某些功能可能存在于一个产品中,但不是其他功能。
Note
Power BI Premium 不支持 PDF。
Prerequisites
None.
支持的功能
- Import
从 Power Query Desktop 连接到 PDF 文件
若要从 Power Query Desktop 建立连接,请执行以下作:
在连接器选择中选择 PDF 选项。
浏览并选择要加载的 PDF 文件。 然后选择“打开”。
如果 PDF 文件处于联机状态,请使用 Web 连接器 连接到该文件。
在 导航器中,选择所需的文件信息,然后选择“ 加载 ”以加载数据或 转换数据 以在 Power Query 编辑器中继续转换数据。
从 Power Query Online 连接到 PDF 文件
若要从 Power Query Online 进行连接,请执行以下操作:
在连接器选择中选择 PDF 选项。
在显示的 PDF 对话框中,提供 PDF 文件位置的文件路径或 URL。 如果要加载本地文件,还可以选择“ 上传文件”(预览版), 浏览到本地文件或拖放文件。
如有必要,请选择本地数据网关以访问 PDF 文件。
如果这是你第一次访问此 PDF 文件,请选择身份验证类型并登录到帐户(如果需要)。
在 导航器中,选择所需的文件信息,然后选择 “转换数据 ”以继续在 Power Query 编辑器中转换数据。
限制和注意事项
访问大型 PDF 文件
可以使用以下策略来提高性能,并减少访问大型 PDF 文件时超时。 这些策略要求你在编辑栏或高级编辑器中编辑 Pdf.Tables 函数的用法。
- 尝试使用
StartPage或EndPage选项一次选择一个页面或一个小范围,根据需要循环访问整个文档。 - 如果 PDF 文档是单个大型表,则
MultiPageTables此选项可以收集非常大的中间值,因此禁用它可能会有所帮助。
可在 Pdf.Tables 中找到可用选项的完整列表。
处理多行数据行
如果无法正确识别多行行数据,则可以使用UI操作或自定义的M代码来清理数据。 例如,可以使用 Table.FillDown 将不对齐的数据复制到相邻行,或者使用 Table.Group 对相邻行进行分组和组合。
高级容量中的 Power BI 数据流
在高级容量中的数据流上使用 PDF 连接器时,PDF 连接器无法正确建立连接。 若要使 PDF 连接器能够在高级容量中处理数据流,请将该数据流配置为使用网关,并确认与该数据流的连接通过网关。