PDF

Summary

Item Description
发布状态 正式发布
Products Excel
Power BI (语义模型)
Power BI (数据流)
Fabric(Dataflow Gen2)
Power Apps(数据流)
Dynamics 365 Customer Insights
支持的身份验证类型 匿名(在线)
基本(在线)
组织帐户(联机)
Windows (联机)
功能参考文档 Pdf.Tables

Note

由于部署计划和主机特定的功能,某些功能可能存在于一个产品中,但不是其他功能。

Note

Power BI Premium 不支持 PDF。

Prerequisites

None.

支持的功能

  • Import

从 Power Query Desktop 连接到 PDF 文件

若要从 Power Query Desktop 建立连接,请执行以下作:

  1. 在连接器选择中选择 PDF 选项。

  2. 浏览并选择要加载的 PDF 文件。 然后选择“打开”。

    从文件资源管理器中选择 PDF 文件。

    如果 PDF 文件处于联机状态,请使用 Web 连接器 连接到该文件。

  3. 导航器中,选择所需的文件信息,然后选择“ 加载 ”以加载数据或 转换数据 以在 Power Query 编辑器中继续转换数据。

    导入到 Power Query Desktop Navigator 中的 PDF 文件。

从 Power Query Online 连接到 PDF 文件

若要从 Power Query Online 进行连接,请执行以下操作:

  1. 在连接器选择中选择 PDF 选项。

  2. 在显示的 PDF 对话框中,提供 PDF 文件位置的文件路径或 URL。 如果要加载本地文件,还可以选择“ 上传文件”(预览版), 浏览到本地文件或拖放文件。

    用于访问 PDF 文件的连接信息。

  3. 如有必要,请选择本地数据网关以访问 PDF 文件。

  4. 如果这是你第一次访问此 PDF 文件,请选择身份验证类型并登录到帐户(如果需要)。

  5. 导航器中,选择所需的文件信息,然后选择 “转换数据 ”以继续在 Power Query 编辑器中转换数据。

    导入到 Power Query 联机导航器的 PDF 文件。

限制和注意事项

访问大型 PDF 文件

可以使用以下策略来提高性能,并减少访问大型 PDF 文件时超时。 这些策略要求你在编辑栏或高级编辑器中编辑 Pdf.Tables 函数的用法。

  • 尝试使用 StartPageEndPage 选项一次选择一个页面或一个小范围,根据需要循环访问整个文档。
  • 如果 PDF 文档是单个大型表,则 MultiPageTables 此选项可以收集非常大的中间值,因此禁用它可能会有所帮助。

可在 Pdf.Tables 中找到可用选项的完整列表。

处理多行数据行

如果无法正确识别多行行数据,则可以使用UI操作或自定义的M代码来清理数据。 例如,可以使用 Table.FillDown 将不对齐的数据复制到相邻行,或者使用 Table.Group 对相邻行进行分组和组合。

高级容量中的 Power BI 数据流

在高级容量中的数据流上使用 PDF 连接器时,PDF 连接器无法正确建立连接。 若要使 PDF 连接器能够在高级容量中处理数据流,请将该数据流配置为使用网关,并确认与该数据流的连接通过网关。