適用対象:
Databricks SQL
Databricks Runtime
数値ペアのグループ間におけるピアソン係数の相関関係を返します。
構文
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
この関数は、ウィンドウ関数 として、OVER句を使用して呼び出すこともできます。
引数
-
expr1: 数値に評価される式。 -
expr2: 数値に評価される式。 -
cond: 集計に使用される行をフィルター処理するブール式 (任意)。
戻り値
DOUBLE です。
DISTINCTが指定されている場合、関数は一意の一連のexpr1expr2ペアでのみ動作します。
例
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0