探索统计摘要
数据通常与统计信息交织在一起,因为统计信息是可以用于探索数据的一种方式。 统计信息可以向您展示数据的分布,帮助您识别关键要点与趋势以及确定是否存在离群值。
统计摘要可以快速简单地描述您的数据。 Power BI 具有许多可帮助您进行统计分析的功能。 通过探索统计摘要,用户可获得可用数据的概要视图,在其中可以查看群集、行为数据的模式、数据平均值等。 他们可以获取有关数据的见解,从而帮助推动业务决策。
例如,供应链团队要求您创建一个报表,其中显示某些产品的下单频率以及销售额排名前十的产品。
统计函数
Power BI 支持许多 Data Analytics Expressions (DAX) 函数,您可以使用这些函数来根据数据快速获取统计信息。 您可以通过右键单击分配到可视化窗格中视觉对象井的可汇总字段来访问这些快速函数,如下图所示。
但是,为了避免性能问题,最好使用以 DAX 编写的表达式自行创建统计度量值。 例如,若要分析每个产品的平均订单数量,您可以创建以下度量值:
Average Qty =
AVERAGE ( Sales[Order Qty] )
直方图
直方图和钟形曲线是显示有关语义模型的统计信息的常用方式。 从 Power BI 方面来说,您可以使用条形图或柱形图视觉对象表示直方图,用面积图视觉对象表示钟形曲线,如下图所示。 还可以使用问答视觉对象来直接提出有关列表中顶部项目或底部项目的问题。
Power BI 中的典型条形图或柱形图视觉对象关联两个数据点:度量值和维度。 直方图与标准条形图略有不同,因为它仅可视化单个数据点。
在此示例中,您可以使用“簇状柱形图”视觉对象呈现一个直方图,它按订单大小确定订单数量。
首先,在可视化窗格上选择“簇状柱形图”图标。 接下来,为 X 轴创建新分组。 我们将在本模块后面介绍分组和分箱,但现在要了解的是,它们在此上下文中也很有用。
若要创建组,请在数据窗格中,右键单击要分析的数据字段,然后选择新建组。 在本示例中,您使用 OrderQty 字段。 在组窗口中,按如下方式配置箱组:
- 将组重命名为 Order Bins (Buckets)。
- 将组类型选项设置为箱,并将箱类型选项设置为箱数。
- 将箱计数设置为 5,将最小值设置为 1,将最大值设置为 44。
接下来,按如下所示填充视觉对象:
- 将
OrderQty字段从数据窗格拖动到可视化窗格的值井中。 - 将
Order Bins (Buckets)字段从数据窗格拖动到可视化窗格的轴井中。
该视觉对象现在显示数据分组为 X 轴上的各个 bucket,而 Y 轴上显示该变量的订单数量。
直方图显示供应链团队的按订单大小排序的订单数量 bucket。
前 N 项分析
TOPN DAX 函数返回指定表的前 N 行。 前 N 项分析是显示可能很重要的数据的常用技术,例如销量最高的 10 个产品、组织中绩效最高的 10 个产品或消费最高的 10 个客户。 或者,您可以从另一个角度来看待它,并在列表中显示底部 N 个项目。 换句话说,业绩最差。 根据具体要求,您可能需要使用其中一种或两种技术。
考虑以下应用场景:供应链团队需要了解销售额最高的前 10 种产品是什么。 您可以通过使用问答视觉对象、前 N 个筛选器或创建 DAX 度量值来完成本任务。
使用问答视觉对象查找前 N 项
假设您为供应链团队创建了一个报表,现在团队成员对他们感兴趣的各种其他视图或见解有疑问。 Power BI 具有内置的问答视觉对象,允许用户提出自己的问题并获取答案。 这意味着您不必使用报表视觉对象来解决单个问题。
问答视觉对象是一种有效工具,因为它允许用户快速、独立地获取有关数据的答案。 这为所有相关人员节省了时间。 问答视觉对象的独特之处在于,它不需要事先了解 Power BI;用户可以提出问题。
将问答视觉对象添加到报表中,然后根据需要重新定位视觉对象并自定义其格式。
现在,您可以使用该视觉对象获取答案。 在本示例中,您想要知道销量最高的 10 个产品是什么,因此您输入一个问题,例如我的销量最高的前 10 个产品是什么?,Power BI 自动为您显示结果。
使用前 N 项筛选器
前 N 项是筛选器窗格中提供的一种筛选选项。 选择要在报表页面上分析的字段(在本示例中为 Product Name 字段)。 在筛选器窗格中,展开筛选器类型列表并选择前 N 项。在显示物料设置中,选择靠前 和 10。 然后,将 Cost of Sales 字段设置为要充当筛选依据的值。
使用 TOPN 函数
您还可以使用 TOPN 函数通过 DAX 计算前 10 个产品。 此函数可用于在其他上下文中显示前 10 个列表,例如前 10 个畅销产品在总销售额中所占的份额。
首先,创建名为 Top 10 Products 的度量值。 然后,结合使用 TOPN 函数和 SUMX 函数,按总销售额计算前 10 个产品,如下所示:
Top 10 Products =
SUMX (
TOPN (
10,
'Product',
'Product'[Total Sales]
),
[Total Sales]
)
下图显示前 10 个产品在总销售额中的占比。
您可以调整 DAX 公式以使用百分比显示相同的结果。
有关 DAX 的统计功能的详细信息,请参阅统计函数。