Identificar valores atípicos con los objetos visuales de Power BI

Completado

Un valor atípico es un tipo de anomalía en los datos. Es algo inesperado o sorprendente según los promedios o resultados históricos. Debe identificar los valores atípicos para aislar los puntos de datos que difieran significativamente de otros puntos de datos y, luego, tomar medidas para investigar las razones de las diferencias. Este análisis puede tener un efecto significativo en la toma de decisiones empresariales.

Imagine que analiza datos para un almacén de envío. Se da cuenta de que el número de pedidos en una categoría de productos concreta ha superado la media. En primer lugar, quiere identificar la categoría de producto. A continuación, se formulará varias preguntas sobre el valor atípico, como las siguientes:

  • ¿Hubo ese día envíos por encima de la media?
  • ¿Esta anomalía ha ocurrido en un almacén específico?
  • ¿Se puede responsabilizar solo a un único evento por el aumento en los pedidos de esa categoría?
  • ¿Ha ocurrido lo mismo otros días durante el último mes, trimestre o año, o en el año anterior?

Power BI le permite identificar valores atípicos en sus datos, pero primero debe determinar la lógica que hay detrás de lo que constituye un valor atípico. Puede usar puntos de desencadenador, como cálculos, en torno a lo que se consideraría el valor atípico.

El proceso de identificación de valores atípicos implica segmentar los datos en dos grupos: uno son los datos del valor atípico y el otro no. Podría usar columnas calculadas para identificar los valores atípicos, pero los resultados serían estáticos hasta que actualizara los datos. Una mejor manera de identificar valores atípicos es utilizar una visualización o medidas, ya que estos métodos garantizan que los resultados sean dinámicos.

Cuando identifique valores atípicos en sus datos, puede usar segmentaciones o filtros para resaltar los valores atípicos. También puede añadir una leyenda a sus objetos visuales para que los valores atípicos se puedan identificar entre el resto de datos. Después, puede profundizar en los datos de valores atípicos para realizar un análisis más detallado.

Uso de un objeto visual para identificar valores atípicos

El mejor objeto visual para identificar valores atípicos es el gráfico de dispersión. Puede mostrar la relación entre dos valores numéricos. Los gráficos de dispersión muestran patrones en grandes conjuntos de datos y, por tanto, resultan idóneos para mostrar valores atípicos.

Al añadir un gráfico de dispersión a su informe, coloque los campos de interés en los depósitos del eje X y el eje Y respectivamente. En este caso, el campo Orders Shipped está en el eje X y el campo Qty Orders está en el eje Y.

Captura de pantalla con la adición de campos para rellenar un gráfico de dispersión

El objeto visual se actualiza para mostrar los datos en función de los campos seleccionados, lo que facilita la detección de valores atípicos, que son los elementos separados de los puntos de datos principales.

Captura de pantalla de un gráfico de dispersión con valores atípicos

Ahora que puede identificar los valores atípicos en los datos, ya está en condiciones de investigar las causas de su existencia y tomar medidas correctivas.

Usar medidas para identificar valores atípicos

Puede crear una medida para identificar valores atípicos en los datos basados en valores específicos. En el siguiente código, Order Qty es una medida en la tabla Sales y Min Qty es una medida que determina la cantidad de pedido más baja en la tabla Sales.

Outliers =
CALCULATE (
    [Order Qty],
    FILTER (
        VALUES ( 'Product'[Product Name] ),
        COUNTROWS (
            FILTER (
                Sales,
                [Order Qty] >= [Min Qty]
            )
        ) > 0
    )
)

Después de crear la medida de valores atípicos, puede agrupar productos en categorías y, después, añadir la medida a un objeto visual de gráfico de dispersión para analizar los valores atípicos y actuar en consecuencia.