应用群集技术

已完成

通过群集,您可以识别彼此相似但与其余数据不同的数据段(群集)。 群集流程不同于您在上一单元中了解的分组流程。

利用 Power BI 群集功能,您可以在数据的子集中快速查找相似数据点的组。 它会分析语义模型以识别属性值中的相似性和相异性,然后将具有相似性的数据划分为数据的子集。 这些数据子集称为群集

例如,您可能要查找销售数据中的模式,例如整体客户行为。 您可以根据客户的相似性(例如年龄或位置)将他们细分为群集。

首先,向报表添加“散点图”可视化,然后将所需字段添加到视觉对象。 在本示例中,您将 Order Qty 字段添加到 X 轴,将 Sales 字段添加到 Y 轴,将 Unit Price 添加到“值”。

下图的散点图中显示了大量数据,所以识别自然组十分困难。

包含产品名称的散点图的屏幕截图。

若要将群集应用于散点图,请在视觉对象右上角选择更多选项 (),然后选择自动查找群集

群集窗口中,您可以根据需要编辑默认名称、字段和描述。 但在本示例中,您想要更改群集数。 如下图所示,默认情况下,群集数框为空,这表示 Power BI 会自动找到它认为最适合您的数据的群集数。

“群集”窗口中的默认设置的屏幕截图。

在框中输入所需的群集数 (3),然后选择确定。 Power BI 将运行群集算法,并创建新的分类字段,其中包含不同的群集组。 现在,当您查看视觉对象时,可以清楚地查看数据中的群集,然后继续对它们执行分析。

应用于散点图的群集的屏幕截图。

新的群集字段会添加到散点图的图例井中,现在您可以像使用任何其他图例字段一样将它用作交叉突出显示的源。 向数据模型中添加一个新的群集字段,您可以在数据窗格中找到它。

如果要编辑群集,请右键单击群集字段,然后选择编辑群集

产品名称(群集)的群集编辑视图的屏幕截图。

在上面的示例中,将群集应用于散点图后,只能使用两个度量值。 如果要使用两个以上度量值来查找群集,可以改用表视觉对象。 在本例中,添加要使用的所有字段,然后使用相同的流程运行群集算法。