使用 Power BI 分析 Azure Data Lake Storage Gen2 中的数据

本文介绍如何使用 Power BI Desktop 分析和可视化存储在具有分层命名空间(Azure Data Lake Storage Gen2)的存储帐户中的数据。

先决条件

在开始本教程之前,必须具备以下先决条件:

  • 一份 Azure 订阅。 转到获取 Azure 免费试用版
  • 具有分层命名空间的存储帐户。 按照 “创建存储帐户” 中的说明创建一个。 本文假设您已经创建了一个名为contosoadlscdm的存储帐户。
  • 确保为存储帐户授予以下角色之一: Blob 数据读取者Blob 数据参与者Blob 数据所有者
  • 存储帐户中一个名为 Drivers.txt 的示例数据文件。 可以从 Azure Data Lake Git 存储库下载此示例,然后将该文件上传到存储帐户。
  • Power BI Desktop。 可以从 Microsoft下载中心下载此应用程序。

在 Power BI Desktop 中创建报表

  1. 在计算机上启动 Power BI Desktop。

  2. 若要连接到示例数据,请按照 Azure Data Lake Storage Gen2 连接器文章中的说明进行操作。

  3. 在 Power Query 导航器中,选择“ 加载”。

    导航器的屏幕截图,其中显示了 Drivers.txt 文件中的数据。

  4. 将数据成功加载到 Power BI 后,以下字段将显示在 “字段” 面板中。

    “字段”面板的屏幕截图,其中显示了 Query1,其中包含“访问日期”、“创建日期”、“修改日期”、“扩展”、“文件夹路径”和“名称”字段。

    但是,若要可视化和分析数据,你可能更喜欢使用以下字段提供的数据。

    数据表的屏幕截图,其中原始表中的“内容”列中的名称和地址显示在行中。

    在后续步骤中,将查询更新为将导入的数据转换为所需格式。

  5. 在功能区的“ 开始 ”选项卡中,选择“ 转换数据”。 然后,Power Query 编辑器将打开,显示文件的内容。

    Power Query 编辑器的屏幕截图,其中包含从原始 Drivers.txt 文件创建的查询。

  6. 在 Power Query 编辑器的“内容”列下,选择“二进制”。 该文件会自动检测为 CSV,并包含以下输出。 数据现在以可用于创建可视化效果的格式提供。

    Power Query 编辑器的截图,显示了“二进制”字段中的数据已展开成包含姓名和地址的表格,并且“导入的 CSV”和“更改的类型”已添加到“应用的步骤”面板中。

  7. 在功能区的开始选项卡中,选择关闭并应用

    Power Query 编辑器的屏幕截图,其中显示了“关闭和应用”选项。

  8. 更新查询后,“ 字段 ”选项卡将显示可用于可视化的新字段。

    Power BI 中的“字段”窗格的屏幕截图,其中 Query1 现在显示 Column1 到 Column8。

  9. 现在,您可以创建饼图,以表示特定国家/地区中每个城市的驱动因素。 为此,请进行以下选择。

    从“ 可视化效果 ”选项卡中,选择饼图的符号。

    “可视化效果”窗格的屏幕截图,其中突出显示了饼图符号。

    在此示例中,要使用的列是列 4(城市名称)和第 7 列(国家/地区的名称)。 将这些列从 “字段 ”选项卡拖动到“ 可视化效果 ”选项卡。

    将 Column4 拖放到“详细信息”中。将 Column7 拖放到“可视化效果”窗格中的“值”中。还将 Column7 拖放到“筛选器”窗格中的“此页面上的筛选器”中。

    饼图现在应类似于下图中的饼图。

    饼图屏幕截图,显示了每个切片的百分比和相应位置的颜色编码,右侧列出了所有位置及其颜色代码。

  10. 如果从页面级别筛选器中选择特定的国家/地区,则会显示所选国家/地区每个城市的司机数量。 例如,在“ 可视化效果 ”选项卡的 “页面级别筛选器”下,选择 “巴西”。

    此页面窗格中的“筛选器”的屏幕截图,其中巴西已选择为要显示的国家/地区。

  11. 饼图会自动更新,以显示巴西城市中的司机。

    巴西各地点的饼图截图,显示每个切片的百分比,右侧的列中列出了所有巴西地点及其颜色代码。

  12. 在“ 文件 ”菜单中,选择“ 保存 ”以将可视化效果另存为 Power BI Desktop 文件。

将报表发布到 Power BI 服务

在 Power BI Desktop 中创建可视化效果后,可以通过将其发布到 Power BI 服务来与他人共享。 有关如何执行此操作的说明,请转到 Power BI Desktop 的“发布”